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PRÓLOGO 


Las nuevas corrientes científicas surgidas en los últimos años 
que se abarcan con la palabra “cibernética”, encuentran su aplica- 
ción más vasta en la rama de la automática y telemecánica. En las 
disciplinas explicadas en esta especialidad se reflejan las cueslio- 
nes de la teoría de la información, teoría de la detección estadís- 
tica de señales, teoría de los sistemas óptimos, teoría de los dispo- 
sitivos automáticos terminales, así como una serie de principios 
basados en las teorías de los juegos y de las decisiones estadísti- 
cas, 

Sin embargo, la exposición de los asuntos de cibernética en 
cursos especiales tropieza con la seria dificultad de que el curso 
tradicional de matemáticas superiores de los centros de enseñanza 
superior técnica, que hace hincapié en lo continuo determinado, 
no brinda el fundamento requerido para el estudio de estas nuevas 
disciplinas cuya base descansa en lo discreto y aleatorio. Estos 
asuntos pueden exponerse en las disciplinas “Fundamentos Mate- 
máticos de la Cibernética” o “Fundamentos Teóricos de la Ciberné- 
tica”. No obstante, en la actualidad no hay libros de texto algunos 
sobre estas asignaluras. 

La presente obra constituye el primer intento de subsanar esta 
deficiencia existente. Ella ha sido preparada fundamentándose en 
la enseñanza de dicha disciplina a los estudiantes de la especia- 
lidad de Automática y Telemecánica y de otras especialidades afi- 
nes en el Instituto Radiotécnico de Riazán. 

El libro consta de la introducción y de dos partes que com- 
prenden diez capítulos. 

En la introducción, además del concepto de sistema cibernético, 
se brindan algunos datos sobre los sistemas de comunicación y 
control, lo que permite ilustrar ciertos métodos matemáticos con 
ejemplos afines a la especialidad. 

En la primera parte se exponen varios capítulos de las mate- 
máticas muy necesarios al ingeniero pero no incluidos en el pro- 
grama de matemáticas superiores de los centros de enseñanza 
superior técnica. El material de la primera parte tiene gran valor 
independiente, ya que permite resolver una serie de tareas de gran 
importancia práctica en la esfera de la automática y lelemecánica. 
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No obstante, la elección del contenido se ha realizado de tal modo 
que la primera parte sirve de introducción matemática a la se- 
gunda parte dedicada a la optimización de los procesos de control 
y que tiene por objetivo introducir al estudiante en el círculo de 
conceptos de la teoría de control moderna. 

Por supuesto que en un libro de volumen limitado como éste 
sólo fue posible saleje una pequeña parte de los conceptos y mé- 
todos utilizados en cibernética. Esto se refiere tanto a la primera 
parte de la obra como, en particular, a la segunda. En especial, la 
optimización de los procesos de control que viene a ser parte esen- 
cial de la teoría general del control, se basa en gran medida, en el 
análisis matemático y el cálculo de variaciones clásicos. Los mé- 
todos de optimización del control elaborados sobre dicha base, 
estudiados por lo común en el curso “Teoría del control automá- 
tico” y en algunos cursos especiales, no han sido examinados de- 
talladamente en las páginas de la obra presente. La atención prin- 
cipal se ha prestado a aquellas ideas y métodos que surgieron 
gracias al desarrollo de la cibernética y la aparición de las calcu- 
ladoras numéricas. Por otra parte, también en estas cuestiones el 
autor, en varios casos, se ha visto obligado a limitarse sólo al bos- 
quejo esquemático de las ideas fundamentales. 

n necesario señalar también que aunque casi todos los méto- 
dos estudiados se ilustran con ejemplos y problemas, los métodos 
numéricos de cálculo sólo pueden dominarse con éxito a base de 
la resolución independiente de problemas, lo que puede garanti- 
zarse realizando cledes prácticas y distribuyendo tareas de cálculo 
sobre este curso. 

El autor considera un deber expresar su gratitud a los críticos 
L. T. Kuzin y D. A. Pospélov, así como al redactor N. 1, Glazunov 
EIN valiosas observaciones contribuyeron a mejorar el contenido 

le la obra. 


El autor 


INTRODUCCIÓN 


1-1. OBJETO DE LA CIBERNETICA 


La cibernética es una ciencia joven que surgió en los primero» 
años después de la Segunda Guerra Mundial y se desarrolló tan 
impetuosamente que en la actualidad ha conquistado posiciones 
firmes en muchas ramas de la ciencia y de la lécnica. La ciberné- 
tica debe sus éxitos al descubrimiento de una serie de analogías 
entre el funcionamiento de los dispositivos técnicos, la actividad 
vital de los organismos y el desarrollo de las colectividades de 
seres vivos. La cibernética reforzó estas analogias derivadas de 
razonamientos generales de carácter metodológico, creando méto- 
dos matemáticos que permitían describir desde un punto de vista 
cuantitativo, los procesos que ocurren en sistemas de la naturaleza 
física más diversa. Los principios de la cibernética encuentran 
vasta aplicación en automática y telemecánica, teoría de la comu- 
nicación, economía, sociología, biología y medicina. 

La propia palabra “cibernética” es de origen griego. Los anti- 
guos griegos designaban con esta palabra el arte de gobernar las 
naves. En el siglo XVIII el término “cibernética” se utiliza por el 
eminente físico y matemático A. M. Ampère para definir la ciencia 
de gobernar el Estado. En su interpretación contemporánea se en- 
tiende por cibernética la ciencia del control en el sentido más 
amplio de esta palabra. La acepción presente del término “ciberné- 
tica" está vinclulada al nombre del gran matemático norteameri- 
cano N. Wiener, cuya obra “Cibernética o control y comunicación 
en el Animal y la Máquina”, que vio la luz en 1948, dio inicio a la 
formación de esta nueva disciplina cientifica. 

La aparición de la cibernética como ciencia del control, está 
ligada al progreso técnico general que caracteriza el desarrollo 
de las fuerzas productivas en la época actual. 

Antes de surgir la cibernética, las principales direcciones del 
desarrollo de la técnica se caracterizaban, en primer lugar, por la 
creación de dispositivos que servian para obtener y transiormar 
la energía (por ejemplo, máquinas de vapor, turbinas, generadores 
de energía eléctrica, motores eléctricos y de otros tipos, etc.) y, en 
segundo, por la creación de dispositivos destinados a influir sobre 
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la naturaleza circundante, En tales dispositivos ta atención princi- 
pal está puesta en las relaciones energéticas siendo el rendimiento 
el indice más importante de su funcionamiento. La sencillez rela- 
tiva de los dispositivos técnicos no situaba en un lugar particular 
el problema del control de los mismos. El hombre trabajaba y man- 
daba simultáncamente el objeto de su trabajo. La información re- 
querida para el mando la obtenia directamente de sus órganos 
sensitivos, observando los resultados de su trabajo. 

Sin embargo, el progreso de la técnica condujo a mediados del 
siglo XX a la creación de sistemas técnicos tan complejos que los 
problemas del control de los mismos comenzaron a superar las po- 
sibilidades fisiológicas del ser humano. A finales de la Segunda 
Guerra Mundial tal Problesia fue la creación de un sistema de 
mando automático del fuego antiaéreo, que, siendo las velocidades 
de los aviones comparables a la velocidad del proyectil antiaéreo, 
podría seguir el curso de los aviones, realizar el cálculo de sus 
trayectorias y apuntar los cañones sin la intervención del hombre. 
En tales sistemas se promueven a primer plano los problemas de 
la obtención de información sobre las condiciones ambientales y de 
la elaboración de dicha información con el objeto de extraer de 'etla 
datos útiles para el control y del empleo de dicha información para 
realizar actividades orientadas hacia una finalidad determinada, 
o sea, los problemas de la creación de dispositivos que sirvan para 
la comunicación y el control. La necesidad de resolver estos pro- 
blemas provocó un rápido progreso en la esfera de la teoría de la 
comunicación, técnica de cálculo y automática, lo que dio inicio 
al desarrollo de aquellas ideas que posteriormente constituyeron 
el fundamento de la cibernética. 

Los dispositivos de comunicación y control difieren substancial- 
mente de los dispositivos técnicos apuntados más arriba, en el sen- 
tido de que en éstos, las relaciones energéticas no juegan un papel 
primordial y se presta atención principal a su capacidad de trans- 
mitir y elaborar sin distorsiones grandes cantidades de informa- 
ción. Así en una línea de radiocomunicación, sólo llega al receptor 
una parte ínfima de la energía irradiada por la antena del radio- 
transmisor y el rendimiento resulta sumamente bajo. No obstante, 
la línea de radiocomunicación se considera buena si los mensajes 
se transmiten por la misma con pequeñas distorsiones y no están 
sometidos a Ja influencia de las interferencias. De este modo, los 
procesos fundamentales en los dispositivos de comunicación y de 
control, son los de transmisión y elaboración de la información y 
no los procesos relacionados con la transformación y utilización 
de la energía. 

La carencia de importancia de las relaciones energéticas en los 
problemas de comunicación y de control permite abstraerse de las 

articularidades físicas de los portadores de la información y' de 
ie naturaleza fisica de los sistemas en los cuales se utiliza dicha 
información. Por eso la cibernética es la teoria general de la comu- 
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nicación y el control, aplicable a cualquier sistema, independiente- 
mente de su naturaleza física. 

El concepto de sistema, además del concepto de control cuyo 
sentido exacto será aclarado más adelante, es el concepto funda- 
mentai de la cibernética. Cualquier sistema real existente consta 
de objetos concretos, en calidad de los cuales pueden intervenir 
dispositivos técnicos, individuos que mandan dichos dispositivos, 
recursos materiales, etc. Estos objetos están vinculados entre sí y 
con el mundo circundante mediante determinados enlaces que cons- 
tituyen fuerzas y flujos de energía, materia e información. Pero 
la cibernética prescinde del contenido físico de las propiedades de 
los objetos y enlaces considerando el sistema real como un con- 
junto abstracto de elementos dotados de propiedades comunes que 
se encuentran en ciertas relaciones mutuas determinadas por el 
carácter de los enlaces existente: 
Tal concepción permite renunciar 
a la división acostumbrada de los 
sistemas en mecánicos, eléctricos, 
químicos, biológicos, etc., e intro- 
ducir el concepto de sistema ciber- 
nético abstracto como conjunto de 
elementos interrelacionados_ que 
influyen unos sobre otros, En la 
figura I-l se da un ejemplo de 
sistema cibernético que consta de - 
cuatro elementos y seis enlaces 
mutuos. Fig. 1-1. Ejemplo de un sistema ci- 

El examen del sistema como bernético 
conjunto de elementos posibilita 
la utilización de la teoría de los conjuntos como instrumento para 
su descripción matemática. Por cierto, en algunos casos de impor- 
tancia es conveniente emplear la lógica matemática como instru- 
mento para describir tos enlaces entre los elementos. Por eso, la 
teoría de los conjuntos y la lógica matemática, con cuya exposí 
ción se inicia la presente obra, constituyen la base de la descrip- 
ción matemática de un sistema. 

Los sistemas que se encuentran en la práclica se dividen, aten- 
diendo a la estructura y el carácter de sus enlaces, en determina- 
dos y probabilísticos. Se denomina determinado el sistema cuyas 
leyes de movimiento se conocen con exactitud y su comportamiento 
futuro puede preverse. Para un sistema probabilístico es imposible 
hacer un pronóstico preciso de su comportamiento futuro, El me- 
canismo de la relojería puede servir de ejemplo de un sistema de- 
terminado. Sin embargo, los sistemas de control estadístico de la 
producción, los sistemas de arribo de buques a los puertos maríti- 
mos o la reserva de mercancías en un almacen que tiene un gran 
número de suministradores y consumidores son sistemas probabi- 
lísticos, 
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Los problemas que resuelve la cibernética conducen en la 
mayoría de los casos a la necesidad de examinar sistemas probabi- 
Iísticos bastante complejos que constan de un gran número de ele- 
mentos y tienen enlaces internos variados y ramificados, Precisa- 
mente a tales sistemas pertenecen la mayoria de los sistemas in- 
dustriales, los sistemas económicos, sociales y biológicos. Para la 
descripción matemática de tales sistemas, además de la teoría de 
los conjuntos y la lógica matemática, se utilizan ampliamente 
como instrumento la teoría de las probabilidades y los-métodos de 
estadística matemática. 

Hasta ahora sólo nos hemos referido a los métodos matemáti- 
cos empleados para describir sistemas cibernéticos. Pero el obje- 
tivo de la cibernética es el control de los sistemas. Para juzgar 
sobre las vías de solución de tal tarea es necesario comprender 
con claridad el sentido del término “control”. 

En el amplio sentido de la palabra, se entiende por control la 
actividad organizativa encaminada a la consecución de objetivos 
determinados que ejecuta las funciones de dirección del trabajo 
ajeno. El proceso de control consiste en la toma de decisiones 
sobre las acciones más convenientes en una u otra situación 
ercada. La persona que lleva a cabo el control toma sus decisiones 
evaluando las condiciones ambientales con ayuda de la informa- 
ción recibida de sus órganos sensitivos, los instrumentos de me- 
dida u otras personas. En muchos casos esta información resulta 
insuficiente para la estimación unívoca de las condiciones ambien- 
tales. Entonces el hombre utiliza su experiencia, conocimientos, 
memoria e intuición. Es un excelente rasgo característico del ser 
humano, su capacidad para tomar decisiones en situaciones de una 
considerable indeterminación en lo que respecta a las circunstan- 
cias ambientales. 

No obstante, en las condiciones de las grandes empresas in- 
dustriales modernas, incluso los conocimientos y la intuición de un 
dirigente experimentado resultan insuficientes para realizar un 
control eficaz. Como resultado surgen deficiencias en el funciona- 
miento de las grandes empresas tales como el trabajo “a la ca- 
rrera”, dificultades con el suministro regular de materias primas 
y materiales sin el aumento excesivo de las reservas, problemas de 
Iransporte, etc. 

La cibernética se plantea la tarea de facilitar al hombre el pro- 
ceso de la toma de decisiones de importancia, encomendando a los 
dispositivos automáticos la recogida y elaboración de grandes can- 
tidades de información respecto al estado del proceso de produc- 
ción, el análisis de las situaciones creadas y la elaboración de re- 
comendaciones acerca de las acciones dirigidas a cierta finalidad. 
Los dispositivos automáticos que ejecutan el conjunto de tales ope- 
raciones se denominan sistemas automáticos de control. El funcio- 
namienlo de tales sistemas se basa en el empleo de las calculado- 
ras electrónicas numéricas (C. E.N.). 
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El papel de las C. E. N. en la cibernética resulta tan importante 
que es menester delenerse para estudiar más detalladamente esta 
cuestión. 

Inicialmente las C.E.N. se utilizaban para realizar cálculos 
tradicionales que antes ocupaban muchas horas y ahora sólo re- 
querían segundos. Pero pronto se hizo evidente que enorme au- 
mento de la velocidad de los cálculos entrañaba efectos cualitat 
vamente nuevos. Si antes el proyectista o el economista sólo podía 
analizar algunas, de las variantes de solución, que por cierlos 
motivos le parecieron dignas de atención, ahora se presentaba la 
oportunidad de comparar todas las variantes posibles y elegir la 
mejor de todas. Así surgieron las ideas de la optimización que 
posteriormente condujeron al desarrollo de una serie de nuevos 
capítulos de las matemáticas. 

Luego resultó que la C.E.N. instalada en una empresa in- 
dustrial es capaz de elaborar con facilidad grandes cantidades de 
información sobre la marcha del proceso de producción y puede 
convertirse en ayudante insustituible del hombre en la administra- 
ción de la producción. 

No obstante, para que las C. E.N. puedan ser utilizadas con 
fines de control, deben ser elaborados métodos matemáticos que 
permitan analizar los tipos de información existentes, desechar la 
información superflua y separar su parte más substancial, em- 
pleando esta información para estimar las situaciones creadas y 
preparar recomendaciones que garanticen el cumplimiento más 
efectivo de los objetivos del control. La necesidad de resolver pro- 
blemas análogos provocó la aparición de tales capítulos de las 
matemáticas como la teoría de la información, teoría de los juegos, 
teoría de las decisiones estadisticas, teoría de colas, la programa- 
ción lineal y dinámica y otros. En la presente obra se estudiará 
una parte de estos nuevos métodos matemáticos. Los demás méto- 
dos se estudian en diferentes cursos especiales. 


1-2. TRANSMISION Y CODIFICACION 
DE LA INFORMACION 


Los enlaces entre los elementos de cierto sistema pueden servir 
para distintos objetivos. Por los mismos pueden transmitirse ener- 
gía, materia, esfuerzos, etc. Pero en los sistemas cibernéticos nos 
interesa, en primer lugar, el contenido informativo de los enlaces, 
es decir, la posibilidad de utilizar dichos enlaces para transmitir 
datos sobre los diversos estados de los elementos del sistema. 

En técnica, cuaiquier dato sobre algún suceso ocurrido dentro 
o fuera del sistema se denomina mensaje. Los enlaces informativos 
que sirven para transmitir los mensajes se denominan canales de 
comunicación. Los portadores físicos de la información en los ca- 
nales de comunicación se llaman señales. En la figura 1-2 se 
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muestra un esquema estructural que representa un canal de comu- 
nicación. 

La palabra “señal” procede de la voz latina signum, o sea, 
que denota símbolos convencionales eléctricos, acústicos, o de otra 
naturaleza que sirven para transmitir mensajes. El tipo de las 
señales es, por lo general, el resultado de un acuerdo entre el 
hombre que transmite la información y el que la recibe y no 
guarda relación directa con el contenido de la información trans- 
ida. Por eso las señales pueden convertirse fácilmente de un 
tipo a otro sin alterar su contenido informativo y también pueden 
almacenarse (por ejemplo, en forma de registro literal) para uti- 
lizar en el futuro dicho contenido. 

Por ejemplo, examinemos el tipo de señales empleadas al 
transmitir un telegrama. El mensaje inicial impreso en el formu- 
lario telegráfico, se convierte a la forma del código Morse que 
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Fig. 1-2, Esquema estructural de un canal de comunicación 


consta de puntos y rayas transmitidos mediante impulsos de co- 
rriente, largos y cortos, por la línea de comunicación. En la parte 
de recepción, por los impulsos captados, se regenera el texto inicial 
del mensaje, Como vemos, en este caso el mensaje existe en cali- 
dad de señales de diferente forma: de texto literal, puntos y rayas 
del código Morse, impulsos de corriente en la línea de comunica- 
ción, etc. La conversión de una señal de una forma a otra se de- 
nomina codificación. 

El método para realizar una comunicación puede representarse 
del modo siguiente. Ante todo debe existir un grupo de símbolos: 
letras, palabras, puntos, rayas, etc., que tengan un sentido cono- 
cido tanto por el remitente como por el destinatario del mensaje. 
El grupo de tales símbolos se denomina alfabeto. Los propios sim- 
bolos se determinan por convenio de las partes. 

La teoría de la comunicación se basa en el postulado de que 
los símbolos componentes de alfabeto no pueden ser infinitamente 
diversos. Por eso, para la transmisión de mensajes cualesquiera 
se utiliza un número limitado de símbolos diferentes. Así, todos 
los mensajes lilerales posibles en lengua rusa se comporien con 
ayuda de un alfabeto de 33 letras. 

Durante el proceso de transmisión el remitente elige del aifa- 
beto existente un simbolo tras otro, los convierte en las señales 
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correspondientes y las transmite por el canal de comunicación. En 
el canal de comunicación, las señales se someten a la influencia 
de las interferencias, lo que provoca su distorsión. Así, las señales 
en la parte de recepción van a diferir de las señales enviadas al 
canal de comunicación. 

El proceso de recepción consiste en que el destinatario, al re- 
cibir cualquier señal, debe identificarla con uno de los símbolos 
existentes del alfabeto, o sea, debe excluir todos los demás simbo- 
los, salvo uno. Esta tarea puede presentar considerables dificulta- 
des si en el canal de comunicación las señales se someten a gran- 
des distorsiones. Los métodos para superar estas dificultades 
constituyen la esencia de la teoría de la comunicación. 

En los sistemas técnicos de comunicación se emplean alfabetos 
de varios tipos. Sin embargo, por diversos motivos, tiene gran 
empleo el alfabeto binario que sólo utiliza dos tipos de simbolos 
designados convencionalmente por 0 y 1. En el alfabeto binario 
cualquier mensaje va a constituir una sucesión de ceros y unida- 
des, por ejemplo 100110100. 

Es fácil calcular que el número total de mensajes que constan 
de m letras del alfabeto binario, será igual a 2". En particular, 
cualquier: letra del alfabeto puede representarse por seis sig- 
nos del alfabeto binario, por ejemplo: a, 000001; b, 000010; c, 
000011, etc. Como que seis signos binarios proporcionan 2% = 64 
diferentes combinaciones de símbolos, con su auxilio pueden re- 
presentarse no sólo todas las letras del alfabeto, sino también los 
signos de puntuación. Por consiguiente, con ayuda del alfabeto 
binario puede representarse y transmitirse por un canal de comu- 
nicación cualquier mensaje literal. 

El alfabeto binario puede utilizarse asimismo para transmilir 
datos numéricos, pero en tal caso resulta necesario emplear ciertos 
sistemas de numeración especiales. 

En el sistema de numeración decimal ampliamente utilizado, 
los diversos números se escriben con ayuda de diez cifras, 0, l,... 
..., 9, dispuestas en determinado orden y que tienen valores de- 
pendientes de la ubicación de cada cifra. Así, la inscripción 
395 representa el número definido por la expresión 


3-10 +9.10 +5- 10% 


¡e Aquí, el número 10 se denomina base del sistema de numera- 
ción. 

Análogamente, cualquier número N puede escribirse en un sis- 
tema de numeración de cualquier otra base R (número entero), con 
ayuda de distintas cifras cuyo número es igual a la base del sis- 
tema de numeración. En tal caso la inscripción .... dsdzdıdo, donde 
d; son las cifras del número N(0 < d; < R), define la magnitud 


N=... daR? + daR? HR 4 de. (11) 
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Así, en el sistema de numeración óctupie que se emplea en 
so tipos de calculadoras numéricas, el número 395 tendrá el 
aspecto 

6-841-814p3-80 


es decir, se escribirá en forma del número 613. 

En caso de utilizarse el alfabeto binario, la inscripción del nú- 
mero deberá efectuarse sólo mediante las cifras 0 y 1, Sirve para 
dicha notación el sistema de numeración binario cuya base es el 
número 2. Cualquier número del O al 15 puede representarse en el 
sistema de numeración binario por medio de un número de cuatro 
digitos: 

3=0-24+0-2+1-214 1-2, o sea, 0011; 
5B=0.24+1-240-21 4 1-2, o sea, 0101; 
9=1-240-2-+4+0-21+1-2, o sea, 1001. 


Naturalmente, no es imprescindible escribir los ceros de órde- 
nes superiores de estos números, es decir, los números 3 y 5 pue- 
den escribirse en forma de 11 y 101, El número 395, que puede ser 
representado por medio de la base 2: 


3H == 42424214 20, 


se escribirá en el sistema de numeración binario con un número 
de nueve dígitos 11000101 1. 

La anotación de números grandes en el sistema de numeración 
binario presenta el inconveniente porque requiere una gran canti- 
dad de dígitos, lo que dificulta la lectura de los números y la 
estimación rápida de su magnitud. Es por elto que con frecuencia 
se emplean sistemas de numeración mixtos, por ejemplo, el deci- 
mal-binario, en el cual el propio número se escribe en el sistema 
de numeración decimal y sus diferentes dígitos, en el sistema de 
numeración binario, utilizando cuatro dígitos binarios para cada 
cifra decimal. De este modo, en el sistema de numeración decimal- 
binario, el número 395 tiene el aspecto: 


0011 1001 oloi. 
=— — == 
3 y è 


1-3. CONCEPTO DE SISTEMA CONTROLADO 


Como se desprende de la definición del concepto de control, 
dada más arriba, cualquier sistema controlado puede representarse 
en forma de un conjunto de dos partes: la parte controlada deno- 
minada también objeto controlado, y ła parte que controla llamada 
dispositivo de control u operador. 

Cada objeto controlado se caracteriza por determinadas pro- 
piedades: 
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1) la existencia de una determinada designación orientada 
hacia una finalidad que se manifiesta en la capacidad de dar cual- 
quier resultado beneficioso; 

2) el estado del objeto que se manifiesta en tipos concretos de 
movimiento y puede cambiar ai variar las condiciones ambienta- 
les en las cuales se halla el objeto; 

3) la capacidad de ser controlable, es decir, la capacidad del 
objeto de reaccionar a las influencias externas ejercidas sobre sus 
órganos especiales, los órganos de control. 

La tarea del operador consiste en garantizar el cumplimiento 
por el objeto de su finalidad actuando sobre los órganos especiales, 
los órganos de control. Para ello debe ocurrir un intercambio de 
información entre el operador y el objeto controlado. Constituyen 
tal información, por un lado, las señales de mando con cuya ayuda 
el operador influye sobre el objeto controlado, o sea, la informa- 
ción de mando y, por otro lado, los datos sobre el estado del objeto 
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Fig. 1-3. Circulación de la información en el sistema controlado 


controlado a base de los cuales el operador determina el tipo de 
señales de mando, es decir, la información de servicio, 

En la figura 1-3 se muestra el esquema estructural que presenta 
los flujos de información principales en el sistema controlado, En 
dicho esquema, además de los flujos de circulación de las infor- 
maciones de mando y de servicio dentro del sistema, se presenta el 
enlace del objeto controlado y del operador con el medio ambiente. 
La variación de las condiciones ambientales ejerce una influencia 
inmediata sobre el objeto controlado provocando el cambio del ca- 
rácter de su movimiento y dificultando el cumplimiento de su fina- 
lidad. Para controlar con acierto el objeto, el operador debe recibir 
información sobre las condiciones ambientales, tomarla en consi- 
deración al elaborar las señales de mando y disponer también de 
información sobre la finalidad del control. 

La información de mando se obtiene elaborando todo tipo de 
datos que llegan al operador. Una parte de la información puede 
almacenarse para ser utilizada posteriormente. Puede ejecutar las 
funciones de operador una persona o un dispositivo mecánico 
o electrónico. En los últimos tiempos es frecuente que las calcula- 
doras electrónicas universales o especializadas jueguen el papel 
de operador. 
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En el objeto controlado ocurre el proceso de elaboración de la 
información de mando que se manifiesta en el cambio del carácter 
del movimiento de dicho objeto. Estos cambios se transmiten por el 
canal de realimentación al operador en forma de información de 
servicio. 

La realimentación juega un papel importantísimo en la reali 
zación de un mando elicne, ya que brinda al operador la posibili- 
dad de juzgar constantemente en el proceso de control, en qué 
medida se ha logrado la finalidad del control, y de acuerdo con 
esto, elaborar de modo más racional las señales de mando. Por 
eso, el principio de realimentación es el fundamento de la inmensa 
mayoría de los procesos de control, y en particular, la base de casi 
toda la actividad del ser humano. Por ejemplo, si una persona 
extiende la mano para tomar de la mesa un lápiz, ella realiza de 
modo inconsciente e ininterrumpido la comparación de la situación 
mutua de la mano y el lápiz, gracias a lo cual el movimiento re- 
sulta muy preciso. 

El objeto del curso “Teoría del control automático” es el estu- 
dio detallado del principio de realimentación. La tarea del curso 
“Fundamentos Matemáticos de la Cibernética” es el análisis de 
los métodos de descripción matemática de los sistemas de control 
automáticos y la explicación de los procedimientos y métodos de 
toma de decisión en los cuales se basa el diseño de dispositivos de 
control. 

Aclararemos el esquema general del proceso de control me- 
diante ejemplos de sistemas de diversa naturaleza física. 

Ejemplo 1-1. El regulador centrijugo de la velocidad de una máquina de va- 
e tig 1-4). En el sistema dado el regulador centrifugo de velocidad juega 

apel 


de Operador. El órgano de control es la mariposa que regula el paso 
del vapor a la máquina de vapor. Antes de comenzar el funcionamiento del 


Regulador 
centrifugo 


Fig. 1-4. Esquema de regulación de la velocidad de la máquina de vapor 


regulador debe introducirse en él información sorbe la finalidad del con- 
trol lo que se logra ajustando el regulador para mantener una velocidad de 
rotación determinada o» mediante la ubicación correspondiente de los pesos y 
el cambio de la tensión de los muelles. La información de servicio sobre la ve» 
locidad de rolación real de la máquina de vapor o, se transforma por el re- 
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gulador centrifugo en cambio de posición del manguito A y dicha información 
de servicio se convierte por medio de una palanca en información acerca de 
la posición de la mariposa que acciona sobre el acceso del vapor a la máquina 
y cambia de este modo su velocidad de rotación. La influencia del medio am- 
Diente se manifiesta aqui en forma de variación de la carga de la máquina de 
vapor, lo que provoca el cambio de su velocidad de rotación 


Fig. 1-5. Sistema de mando de un proyectil antiaéreo telegulado 


Ejemplo 1.2. El jefe de movimiento del transporte ferroviario. En el ejemplo 
daaa iemaple la unción de operador la persona jefe de movimiento que hallan- 
dose en el puesto de gobierno recibe por el selector o teléfono la información 
de servicio sobre el estado de los trenes en aquel sector de la linea del cual 
es responsable, Esta información consiste en datos acerca de la disposición para 
la partida de un tren de turno, el retraso de un tren con respecto al gráfico 
de marcha de los trenes, la necesidad de partida de un tren fuera de turno (no 
previsto en el gráfico), el grado de carga de la linca, etc. La obligación del jefe 
de movimiento consiste en transformar la información recibida y elaborar de- 
cisiones encaminadas al cumplimiento óptimo del gráfico de marcha de los tre- 
nes. Esta información de control consta de disposiciones para los maquinistas 
o jefes de estaciones sobre el orden ulterior del movimiento de los trenes (sobre 
ia aceleración o deceleración de la marcha de los trenes, la maniobra del paso 
de los mismos a los aparladeros, etc.). 

Ejemplo 1-3. El mando del prouectil antiaéreo. En calidad de ejemplo del 
sistema automático en el cual juegan el papel de operador dispositivos calcula- 
dores electrónicos, en la figura 1-5 se muestra el esquema funcional de mando 
de un proyectil antiaéreo teledirigido a un objetivo móvil. En este sistema, la 
información de servicio está contenida en las señales suministradas por la'es- 
tación de radiodetección E. R. O., que determina las coordenadas del objetivo 
móvil O y por la estación de radiodetección E. R. P. que determina las coor- 
denadas del proyectil P que se mueve hacia el objetivo. Basándose en estos 
tipos de información, la calculadora de mando elabora las señales que llegan 
por la Tinea de radio al dispositivo de mando del proyectil antiaéreo y que co- 
trigen su movimiento según la posición mutua del proyectil y el objetivo, 


PROBLEMAS PARA LA INTRODUCCION 


1-1. Un sistema consta de siete elementos, cada uno de los cuales se comu- 
nica con todos los demás mediante enlaces del tipo más sencillo que tienen 
sólo dos estados: “hay eulace” y “no hay enlace”, ¿Cuál es el número posible 
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de estados de tal sistema? Si es preciso indicar mediante un experimento todos 
los estados que poseen la propiedad P y para investigar cada estado se requiere 
1 s, ¿cuánto tiempo se necesitará para investigar lodos los estados posibles? 

1-2. ¿En cuánto disminuye el número de estados posibles del sistema en el 
problema 1, si sólo hay enlaces direccionales sucesivos (fig. 1-6,a) o el sistema 
tiene estructura jerárquica (fig. 1-6,6)> Cite ejemplos de Sistemas que tengan 
estructuras de ambos pos. 

1-3. El polinomio (I-t) que sirve para la representación de un número en 
el sistema de numeración de base R, puede escribirse en la forma 


N = (Me da) RA da) R + di) R + dor (12) 
lo que equivale a la secuencia de fórmulas 
NSN R +da Ni=W Rh dis Na VR Eda 


Fundamentar con ayuda de estas fórmulas la siguiente regla de conversión 
del número 395 de la forma decimal a la óctuple 


305:8.=49 resto 3 o más brevemente 395 
49.8=8 resto 1 4913 
6:8=0 resto 6 s|1 

o 


lo que la el número óctuple 613. 


AE S > 
b) 


Fig. 1-6. Sistemas con enlaces sucesivos (a) y estructura jerárquica 


Cómo formularía Ud. la regla para convertir un número de la forma de- 
cimal en la binaria? 

1-4, Escriba en los sistemas de numeración binario, óctuple y sexadecimal 
los números siguientes (dados en el sistema de numeración decimal): 


27, 467, 519, 1263. 


Nota. Emplear las letras a, b, c, d, e, f del alfabeto romano como cifras 
del 10_al 15 del sistema de numeración sexadecimal. 

1-5. Escriba los números del problema 1-4 en los sistemas de numeración 
decimal-binario y óctuple-binario. ¿Cuántas cifras binarias tuvo que utilizar Ud. 
para escribir una cifra óctuple? ¿Cuál de estos dos sistemas de notación de 
números es más económico desde el punto de vista del número de cifras bina- 
rias utilizadas? 

1-6. Tienen o no circuito de realimentación los siguientes sistemas de con- 
trol del tráfico urbano: 

1) con ayuda de un semáforo en el cual se encienden sucesivamente las lu- 
ces roja, amarilla y verde durante un tiempo previamente convenido; 

2) con ayuda de un policia de tráfico. 

1-7. Halle el circuito de realimentación en los esquemos de las figuras 1-4 
e 15 
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z espacio de resultados del experimento 
z resultado del experimento, magnitud aleatoria 
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magnitud aleatoria centrada 
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P (S), Pg Probabilidad de un suceso 

p (218) distribución condicional de probabilidades 
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Parte primera 


FUNDAMENTOS 
DE MATEMÁTICAS 
DISCRETAS 


Capítulo primero 


CONCEPTOS BASICOS 
DE LA TEORIA 
DE LOS CONJUNTOS 


1-1. CONJUNTOS FINITOS E INFINITOS 


a) Definiciones fundamentales 


El concepto de conjunto es uno de aquellos conceptos funda- 
mentales de las matemáticas a los cuales es dificil dar una defini- 
ción precisa utilizando conceptos elementales. Por eso nos limita- 
remos a dar una explicación descriptiva del concepto de conjunto. 
Sé denomina conjunto a un grupo de objetos determinados comple- 
tamente diferenciables que se consideran como un todo. 

Se puede hablar del conjunto de sillas en una habitación, el 
conjunto de personas que viven en la ciudad de Riazán, el con- 
junto de estudiantes en un grupo, el conjunto de números enteros 
positivos, el conjunto de letras en el alfabeto, el conjunto de esta- 
dos de un sistema, etc. Por cierto, sólo se puede hablar de conjunto 
cuando los elementos del mismo son diferenciables entre sí. Por 
ejemplo, no se puede hablar del conjunto de gotas en un vaso de 
agua ya que no es posible señalar, precisa y claramente, cada gota 
por separado. 

Llámanse elementos los distintos objetos de que consta un 
conjunto. Así, el número 3 es un elemento del conjunto de los nú- 
meros enteros positivos y la letra 6 es un elemento del conjunto 
de las letras del alfabeto ruso. 

Sirve de notación general de conjunto, un par de corchetes { }, 
dentro de los cuales se enumeran los elementos del conjunto. Para 
designar los conjuntos concretos se utilizan distintas letras mayús- 
culas A, S, X ... o letras mayúsculas con subíndices Ay, Az... 
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Para designar los elementos de un conjunto en forma general se 
emplean diversas letras minúsculas a, $, x ... o letras minúsculas 
con subíndices ay, dp... 

Si deseamos indicar que el objeto a es un elemento del con- 
junto S escribimos a Œ S y decimos que el objeto a es un elemento 
del conjunto S o que a pertenece al conjunto 3, Ahora, si queremos 
señalar que a no es un elemento del conjunto S, entonces escribi- 


mos a$ S. Vamos a emplear la notación xı, X2 ..., Xx =S en 
calidad de abreviatura para la notación x; € S, Xx € S, ..., Xn € 
e 


Los conjuntos pueden ser finitos e infinitos. Un conjunto se de- 
nomina finito si es finito el número de sus elementos, es decir, si 
existe un número entero positivo N que es el número de elementos 
del conjunto. Un conjunto se llama infinito, si consta de un nú- 
mero infinito de elementos. 

Para operar con conjuntos concretos hay que saber presentar 
dichos conjuntos. Existen dos métodos de presentación de conjun- 
tos: la enumeración y la descripción. La presentación de un con- 
junto por el método de enumeración consiste en la enumeración de 
todos los elementos que constituyen el conjunto. Asi, el conjunto 
de estudiantes sobresalientes de un grupo estudiantil puede presen- 
tarse enumerando los estudiantes que obtienen notas de sobresa- 
liente, por ejemplo (Ivanov, Petrov, Sidorov}. Este método es con- 
veniente para el estudio de los conjuntos finitos que contienen un 
número reducido de elementos, pero a veces se puede utilizar para 
presentar conjuntos infinitos, por ejemplo (2, 4, 6,8... .), Natural- 
mente, tal notación es aplicable si está del todo claro qué se com- 
prende por los puntos suspensivos. 

El método descriptivo de presentación de un conjunto consiste 
en que se indica la propiedad característica que poseen todos los 
elementos del conjunto. Así, si M es el conjunto de estudiantes de 
un grupo, el conjunto A de estudiantes sobresalientes de dicho 
grupo se escribe en la forma 

A=(x=M:x, estudiante sobresaliente del grupo), 
lo que se lee del modo E el conjunto A consta de los ele- 
mentos x del conjunto que poseen la propiedad de que x es 
estudiante sobresaliente del grupo. 

En los casos en que no suscita dudas de cuál conjunto se toman 
los elementos x, puede no indicarse la pertenencia de x al con- 
junto M. En tal caso el conjunto A se escribirá en la forma 


A = (x: x, estudiante sobresaliente del grupo). 


Pongamos algunos ejemplos de presentación de conjuntos por 
el método descriptivo: 


fx: x, par) es el conjunto de los números pares; 
{x; x?— 1 = 0} es el conjunto (HI, —1). 
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Supongamos que C es el conjunto de los números enteros. En- 
tonces (x= C:0 < x < 7} es el conjunto (1, 2, 3, 4, 5, 6, 7). 

El concepto de conjunto vacío es un importante concepto de la 
teoría de los conjuntos. Se denomina conjunto vacio el que no con- 
tiene ningún elemento. El conjunto vacío se designa por Ø. Por 
ejemplo, 

(xsC:ié—=x+1=0=Q2. 


El concepto de conjunto vacío juega un papel importantísimo 
al presentar un conjunto por medio de su descripción. Sin el con- 
cepto de conjunto vacio no podriamos hablar del conjunto de estu- 
diantes sobresalientes de un grupo estudiantil o de raíces reales 
de una ecuación cuadrática sin habernos cerciorado previamente 
de si hay estudiantes sobresalientes algunos en el grupo dado o de 
si la ecuación considerada tiene raíces reales. La introducción del 
conjunto vacío permite operar con plena tranquilidad con el con- 
junto de estudiantes sobresalientes del grupo sin preocuparse de 
si hay o no estudiantes sobresalientes en el grupo examinado. Va- 
mos a incluir convencionalmente los conjuntos vacíos en los con- 
juntos finitos. 

Consideremos ahora la cuestión de la igualdad de los conjun- 
tos. Dos conjuntos se denominan iguales si constan de los mismos 
elementos, o sea, si vienen a ser un mismo conjunto. Los conjun- 
tos X e Y no son iguales (X æ Y), si en el csafinia X hay ele- 
mentos que no pertenecen a Y, o en el conjunto Y existen elemen- 
tos no OS a X. Es fácil ver que para conjuntos cuales- 
quiera X, Y y Z: 

X=X; 


si X=Y, entonces Y =X; 
si X=Y e Y=Z, entonces X =Z. 


De la definición de igualdad de conjuntos se desprende que no 
importa el orden de los elementos en el conjunto. Así, por ejemplo, 
los conjuntos (3, 4, 5, 6) y (4, 5, 6, 3) resultan ser un mismo con- 
junto. 

Con frecuencia, al estudiar diversos conjuntos es preciso refe- 
rirse al número de elementos del conjunto. Para que este concepto 
quede definido por completo es necesario convenir en que en un 
conjunto nunca hay elementos iguales. La notación (2, 2, 3, 5) debe 
considerarse incorrecta y sustituirse por (2, 3, 5). De este modo, el 
conjunto de los divisores primos del número 60 es igual a (2, 3, 5}. 


b) Concepto de subconjunto 


El conjunto X constituye un subconjunto del conjunto Y, si 
qualquier elemento del conjunto X pertenece también al conjunto Y. 
Sea Y el conjunto de los estudiantes de un grupo y X, el conjunto 
de los estudiantes sobresalientes del mismo grupo. Como que cada 
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estudiante sobresaliente del grupo es a la vez estudiante de dicho 
grupo, el conjunto X es un subconjunto del conjunto Y. 

Muchas definiciones de la teoría de los conjuntos se exponen 
cómodamente en forma de expresiones matemáticas que contienen 
algunos símbolos lógicos. Utilizaremos dos de estos símbolos para 
definir el subconjunto: 

V, simbolo denominado cuantificador y que significa “cual- 
quier”, “cualquiera que sea”, “para todos”; 

>, simbolo de corolario (implicación) que significa “implicar”. 

La definición de subconjunto que puede formularse asi: para 
cualquier x la afirmación «x pertenece a X” implica la aseveración 
“x pertenece a Y”, se escribirá del modo siguiente: 


VriixeX>oxsY. (1-1) 


Una notación más concisa de la expresión “X es un subcon- 
junto de Y” es la transcripción 


xsY, (1-2) 


que se lee “Y incluye a X”. El simbolo = empleado aquí denota 
inclusión. Si se desea recalcar que Y incluye también a otros ele- 
mentos además de los elementos de X, se utiliza el simbolo de 
inclusión estricta =: 

Zey: (1-3) 


La relación entre los simbolos = y & se muestra con la ex- 
presión 
XCYZXSY y XAY. (1-4) 


Aquí se emplea el símbolo == que denota equivalencia (con el 
significado “es lo mismo que”). 
Mencionemos algunas propiedades de los subconjuntos que se 
derivan de su definición: 
x=X (reftexividad); 


[XsY e Y=sZ]>X=Z (transitividad). 


Es algo más difícil de comprender que para cualquier con- 
junto M 
DM (1-5) 


En efecto, el conjunto vacio Ø no contiene elementos. Por con- 
siguiente, al adicionar a M un conjunto vacío, de hecho no aña- 
dimos nada. Por eso, siempre se puede considerar que cualquier 
conjunto M contiene en sí un conjunto vacío en calidad de subcon- 
junto. 


c) Límites superior e inferior de un conjunto 


Al operar con el conjunto de los números reales pueden com- 
pararse en magnitud los elementos de dicho conjunto. Al hacerlo, 
surge con frecuencia el problema de determinar el elemento mayor 
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o menor del conjunto. Para un conjunto finito este problema no 

resenta dificultad. Así, para el conjunto T = {3, 4, 5, 6) mín 
FS y máx T = 6. Sin embargo, para los conjuntos infinitos la 
situación puede ser diferente. 

Sea R el conjunto de todos los números reales, siendo S = 
=(reR:m<x=<M). El conjunto S constituye un segmento 
abierto del eje real y no contiene los elementos mayor y menor. No 
obstante, puede hablarse de los límites de tal conjunto entendién- 
dose por éstos los números m y M que complementan el conjunto S 
hasta el segmento cerrado. En tal caso el punto M se denomina 
limite superior del conjunto S o supremum y se designa por M = 
= sup S, y el punto m se llama límite inferior del conjunto S o in- 
finum y se designa con m = inf S. 

Teorema 1-1 (teorema de los límites superior e inferior de un 
subconjunto). Si B = A, entonces 


inf B> inf A; supB<sup A. (1-6) 


Demostración. Designemos por b’ el elemento del conjunto B 
que tiene el valor menor, o sea, b’ & B y b’ = inf B. Pero BS A, 
es decir, b” & A. Sea a’ el elemento del conjunto A que posee el 
menor valor, o sea, a” A y a' = inf A. En tal caso, si b’ = a", 
entonces b’ = inf A y si b’ Ż a”, entonces b’ > a = inf A. De este 
modo, b’ > inf A o inf B > inf A. 

La segunda parte del teorema se demuestra análogamente. 


1-2, OPERACIONES CON CONJUNTOS 


a) Observaciones preliminares 


Con conjuntos pueden realizarse operaciones que recuerdan en 
mucho las operaciones de adición y multiplicación del álgebra cle- 
mental. Para comprender mejor las operaciones con conjuntos hay 
que rememorar las leyes existentes en el álgebra elemental. 

Sean a y b ciertos números, a + b su suma y ab su producto. 
La suma y el producto de estos números tienen las propiedades 
siguientes denominadas leyes del álgebra: 

1. a+ b = b + a; ab = ba, ley conmutativa; 

2 (a+ b)+ c= a + (b+c); (ab)c = a(bc), ley asociativa; 

3. (a +b)c = ac + bc, ley distributiva. 

Observemos que en las Ra asociativa y conmutativa la ope- 
ración de adición puede sustituirse pòr la de multiplicación y vice- 
versa. En tai caso se obtendrá otra ley que será tan válida como 
la primera. Sin embargo, en la ley distributiva no existe tal si- 
metría. Si en dicha ley se reemplaza la adición por ia multiplica- 
ción y viceversa, llegamos al absurdo: 


(ab) + c = (a + c) (b + 0). 
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Cabe preguntar, ¿ acaso sucede siempre asi? ¿No existe acaso 
un álgebra en la cual la ley distributiva sea también simétrica con 
respecto a las operaciones de adición y multiplicación como las 
leyes conmutativa y asociativa? Resulta que existe un álgebra, y 
precisamente el álgebra de los conjuntos, en la que todas las tres 
leyes son simétricas respecto a las operaciones de adición y multi- 
plicación. 

La similitud entre las operaciones de adición y multiplicación 
se manifiesta asimismo, en la existencia de dos excelentes números 
que son 0 y 1 tales que la adición del primero y la multiplicación 
por el segundo no modifican ningun número: 


a+0=a, a: 1=a. 


Notemos que la segunda relación se obtiene de la primera 
sustituyendo (+) por (+) y 0 por 1. 

No obstante, en este asunto tampoco va muy lejos el parecido 
entre las operaciones de adición y multiplicación. Así, el número 0 
juega un papel algo particular en comparación con todos los de- 
más números, incluso la unidad. Este papel peculiar del número 0 
se deriva de la relación a-0 = 0. Si en dicha expresión sustituimos 
(+) por (+) y 0 por 1 llegamos a la relación a + 1 = 1 que casi 
nunca será correcta, 

Como veremos más adelante, la similitud entre el cero y la 
unidad resultará mucho mayor en el álgebra de los conjuntos que 
en el álgebra ordinaria. 

Después de estas observaciones preliminares puede iniciarse el 
estudio de las operaciones con conjuntos. 


b) U 


Se denomina unión de los conjuntos X e Y aquel que consta de 
todos aquellos y sólo aquellos elementos que pertenecen siquiera 
a uno de los conjuntos X, Y, es decir, pertenecen a X o a Y. La 
unión de X e Y se designa por X U Y. La definición formal es 


XUY=(x:xX o xeY). (1-7) 


n de conjuntos 


La unión de conjuntos se llama a veces suma de conjuntos y se 
designa por X + Y. No obstante, las propiedades de la unión de 
conjuntos difieren un tanto de las propiedades de la suma en su 
sentido aritmético habitual. Por eso no vamos a emplear este 
último término. 

Eeen E Si X = (1, 2, 3, 4, 5) e Y = {2, 4, 6, 7), entonces XUY = 
= (1, 2, 3, 4,5, 6, 7). 

Èjemplo 1-2. Si X es el conjunto de estudiantes sobresalientes en un grupo, 
e Y, el conjunto de estudiantes que viven en una residencia estudiantil, enton- 
ces'X U Y es el conjunto de estudiantes que cursan estudios con notas de so- 
bresaliente o habitan en dicha residencia. 
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Ejemplo 1-3. Examinemos los dos circulos mostrados en la figura 1-1. Si X 
es el conjunto de puntos de circulo izquierdo e Y, el conjunto de puntos del 
cisculo derecho, entonces X YY constituye la zona rayada delimitada por am- 
bos circulos, 


J Y 


Pig. 1-1. Unión de conjuntos 


El concepto de unión puede hacerse extensivo también a un nú- 


mero mayar de conjuntos. Designemos por M = ([X,, ..., Xn) la to- 

talidad de los n conjuntos X,, ..., Xn que a veces se denomina 
sistema de conjuntos. La unión de estos conjuntos 
X= “=XU... UX, 

yrs Yp XAU. UX, (1-8) 


representa el conjunto que consta de todos aquellos y sólo aquellos 
elementos que pertenecen siquiera a uno de los conjuntos del 
sistema M. 

Para la unión de conjuntos son válidas las leyes conmutativa 


y asociativa 
XUY=YUX; (1-9) 
(XUNUZ=XUYUZ)=XUYUZ, (1-10) 
cuya validez se deriva de que los miembros izquierdo y derecho 
de las igualdades constan de los mismos elementos. Además, 
xuUD=X. (1-11) 


Esta relación es también evidente ya que un conjunto vacio no 
contiene elementos y esto significa que X y X U Ø constan de los 
mismos elementos. Én (1-11) se ve que el conjunto vacío Ø Juega 
en el álgebra de los conjuntos el papel de cero. Aquí existe analo- 
gía con la expresión a + 0 = a del álgebra ordinaria. 


c) Intersección de conjuntos 


Se denomina intersección de los conjuntos X e Y el conjunto 
que consta de todos aquellos y sólo aquellos elementos que perte- 
necen tanto al conjunto X como al Y. La intersección de los con- 
juntos X e Y se designa por XN Y. La definición formal es 
XOYíx:xeX y xeY). (1-12) 

La intersección de conjuntos se denomina a veces producto de 
conjuntos y se designa por XY, Sin embargo, las propiedades de 
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la intersección de conjuntos difieren un tanto de las propiedades 
áel producto en su sentido aritmético habitual. Por eso no vamos 
a emplear dicho término. 
Ejemplo 1-4. Para los conjuntos X e Y en el ejemplo 14 X N Y = (2 4). 
Ejemplo 1-5. Para los conjuntos X e Y en el ejemplo 1-2 Xf Y es el con: 
junto de estudiantes sobresalientes, que viven en la residencia estudiantil, 
Ejemplo 1-6. Examinemos log; sos circulos mostrados en la figura 1-2 Si X 
es el conjunto de puntos de círcilo izquierdo e Y, el conjunto de puntos del 


x E 


Fig. 1-2. Intersección de conjuntos 


circulo derecho, entoces Xf Y representa la zona rayada que constituye la 
parte común de ambos círculos. 


La operación de intersección permite establecer una serie de 
relaciones entre dos conjuntos. 

Los eonjuntos X e Y se denominan no intersecados si éstos no 
tienen elementos comunes, es decir, si 


XNY=9. (1-13) 


Ejemplo 1-7. Son conjuntos no intersecados: 

1) los conjuntos (1, 2, 3) y (4.5, 6): 

2) el conjunto de estudiantes sobresalientes y el conjunto de estudiantes 
désaprovechados en uh, grupo estudiantil; 

3) los conjuntos de puntos de los círculos X e Y en la figura 1-3, 


x Y 


O 


Fig. 1-3. Conjuntos no intersecados 


Se dice que los-conjuntos X e Y se encuentran en posición co- 
mún si se cumplen las tres condiciones siguientes; 

existe un elemento del conjunto X que no pertenece a Y; 

existe un elemento del conjunto Y que no pertenece a X; 

existe un elemento que pertenece tanto a X como a Y. 

Señalemos una diferencia entre el álgebra de los conjuntos y el 
álgebra de los números. Si a y b son dos números, entre ellos 
pueden existir tres relaciones o posibilidades 


a<b, a=b, b<a. (1-14) 
“n 


Sin embargo, para dos conjuntos X e Y puede no cumplirse 
ninguna de las relaciones: 


XCY, X=Y, YX. (1-15) 


Así pues, si X es el conjunto de estudiantes sobresalientes e Y 
es el conjunto de estudiantes que viven en la residencia estudiantil, 
las tres relaciones antes dadas significan; 

X&Y, cada estudiante sobresaliente vive obligatoriamente en 
la residencia estudiantil; 

X = Y, en la residencia estudiantil viven todos los estudiantes 
sobresalientes y sólo ellos; 

Y œ X, todos los estudiantes que habitan en la residencia eslu- 
diantil son estudiantes sobresatieñtes, 

Es evidente que estas relaciones no agotan todas las posibili- 
dades. En efecto, como se desprende de las definiciones anteriores, 
entre los dos conjuntos X e Y puede haber una de las relaciones 


siguientes: 
X=Y; XEY; YX, XNY=0; 


X e Y están en posición común. 

Se puede extender también el concepto de intersección a un 
número de conjuntos mayor de dos. Examinemos el 'sistema de con- 
juntos M = (X,, ..., Xn}. La intersección de estos conjuntos se 
escribe en la forma 


n 
N x=UXx=X0N... NX. (1-16) 
ri 


y representa un conjunto roys elementos pertenecen a cada uno 
de los conjuntos del sistema M. 

Es fácil ver que la intersección de conjuntos posee la propiedad 
conmutativa 


XNY=YNX (1-17) 
y la asociativa 
ANVYNAZ=XNYNZ)=XNYNZ. (1-18) 
+ Notemos también que tiene lugar la relación 
XxND=0, (1-19) 


similar a la relación a-0 = 0 del álgebra ordinaYla. La relación 
(1-19), junto con la relación (1-11), demuestra que el conjunto 
vacío juega el papel de cero en el álgebra de los conjuntos. 


d) Diferencia de conjuntos 


La operación dada se distingue de las operaciónes de unión € 
intersección en que se define solamente para dos conjuntos. Se 
denomina diferencia de los conjuntos X e Y el conjunto que constá 
de todos aquellos y sólo aquellos elementos que pertenecen a X y 


> 35 


no pertenecen a Y. La diferencia de los conjuntos X e Y se designa 
por XN Y. De este modo, 


XxY=(x:xeX, x4Y). (1-20) 


Ejemplo 18. Para los conjuntos X e Y del ejemplo 1-1 XN Y = (1, 3, S} 
YN X= (6, 7). Si X e Y son los conjuntos del ejemplo 1-2, entonces XN 
es el conjunto de estudiantes sobresalientes que no viven en la residencia estu- 
diantil. Para los conjuntos X e Y del ejemplo 1-3 X \ Y es la zona rayada de 
la figura 1-4. ' 


W-E 


Fig. 1-4. Diferencia de conjuntos 


e) Conjunto universal 


Como hemos visto, el conjunto vacío representa el papel de 
cero en el álgebra de los conjuntos. Puede preguntarse si no existe 
acaso un conjunto / que juegue el papel de unidad, o sea, que sa- 
tisfaga la condición 


XxNnI=X, (1-21) 


similar a la condición a- del álgebra ordinaria. 

La relación (1-21) significa que la intersección o “parte co- 
mún” del conjunto / y del conjunto X, para cualquier conjunto X 
coincide con este mismo conjunto. Pero eso sólo es posible en caso 
de que el conjunto / contenga todos los elementos de los cuales 
puede constar el conjunto X, de suerte que cualquier conjunto X 
esté totalmente contenido en el conjunto /. El conjunto / que satis- 
face esta condición se denomina completo o universal, o bien uni- 
tario. 

Partiendo de lo expuesto puede darse la siguiente definición 
de conjunto universal. Si en cierto análisis sólo participan los sub- 
conjuntos de cierto conjunto invariable /, entonces dicho conjunto 
mayor / se denomina conjunto universal. 

s preciso señalar que en los diversos análisis concretos pue- 
den representar el papel de conjunto universal diferentes conjun- 
tos. Así, pues, al estudiar los conjuntos de estudiantes en un grupo 
(estudiantes sobresalientes, estudiantes becados, estudiantes que 
viven en la residencia estudiantil, etc.), juega el papel de conjunto 
universal el conjunto de estudiantes en el grupo. 

Es cómodo representar gráficamente el conjunto universal en 
forma del conjunto de los puntos de un rectángulo, Las distintas 
zonas dentro de dicho rectángulo van a denotar los diversos sub- 
conjuntos del conjunto universal. La representación de los conjun- 
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tos en forma de zonas de un rectángulo que es un conjunto univer- 
sal se denomina diagrama de Euler— Venn, 

El conjunto universal posee una interesante propiedad que no 
tiene análogo en el álgebra ordinaria, a saber: para cualquier 
conjunto X es válida la relación: 


XUI=1. (1-22) 


Efectivamente, la unión X U 7 constituye el conjunto del cual 
forman parte todos los elementos tanto del conjunto X como del Z. 
Pero el conjunto / ya incluye todos los elementos del conjunto X, 
por lo que X U Z va a constar de los mismos elementos que /, O 
sea, constituye el conjunto más universal Z. 


$) Complemento de un conjunto 
El conjunto X definido por la relación 


X=INX, (1-23) 


se denomina complemento del conjunto X (hasta el conjunto uni- 
versal 1). En el diagrama de la figura 1-5 la zona no rayada re- 


Fig. 1-5, Complemento de un conjunto 


presenta el conjunto X. La definición formal es 


X=(x:xel y 14%X). 

gae 1-9, Si I = {1, 2, 3, 4, 5, 6, 7) y X = (3, 5, 7), entonces X = (1, 2, 

De (1-23) se deriva que X y X no tienen elementos comunes, de 
manera que pa 

xnXx=9. (1-24) 

Además, no existen elementos de 7 que no pertenezcan a X ni 


a X, ya que los elementos que no pertenecen a X pertenecen a X. 
Por lo tanto, 


XUX=I. (1-25) 


De la simetria de la fórmula (1-25) respecto a X y X se deduce 
no sólo que X es el complemento de X, sino también que X es el 
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complemento de X. Pero el complemento de X es Ñ. De este modo, 


X=X. (1-26) 


Con ayuda de la operación de complementación puede repre- 
sentarse la diferencia de conjuntos en la cómoda forma siguiente: 


XxXY=(:xeX y x2Y)=(x:xeX y Xe} 
O sea, 
ANY =XNY. (1-27) 


g) Fraccionamiento de un conjunto 


Una de las operaciones con conjuntos que se encuentran más 
frecuentemente es la operación de fraccionamiento de un conjunto 
en un sistema de subconjuntos. Así pues, el sistema de cursos de 
una facultad dada constituye el fraccionamiento del conjunto de 
estudiantes de dicha facultad; el sistema de los grupos de un curso 
dado es el fraccionamiento del conjunto de estiddiantes del curso. 
Si N es el conjunto de los números enteros positivos, siendo Ao y 
Aı los conjuntos de los números pares e impares, entonces el sis- 
tema (Ao, A) será el fraccionamiento del conjunto N. El conjunto 
de los números enteros positivos puede fraccionarse de otro modo, 
a saber: en los conjuntos de los números divisibles entre 3 sin 
resto, con resto 1 y con resto 2. La producción de una empresa se 
fracciona en el sistema de conjuntos que constan de los productos 
de primera clase, segunda clase y artículos defectuosos. Se podrian 
citar infinitos ejemplos similares. 

Para dar una definición regurosa del concepto de fracciona- 
miento, examinemos cierto conjunto M y el sistema de conjuntos 
M = (Xi, ..., Xn}. El sistema de conjuntos M se denomina fraccio- 
namiento del conjunto M si satisface las condiciones siguientes: 

1) cualquier conjunto X de M es subconjunto del conjunto M 


VX=M:X=M; (1-28) 
2) dos conjuntos cualesquiera X e Y de M no son intersecados 
VXSENM, WeNM:X4Y>XNY=0; (1-29) 


3) la unión de todos los conjuntos que forman parte del fraccio- 
namiento da el conjunto M 


U x=M. (1-30) 


xR 


Volveremos al concepto de fraccionamiento durante el estudio 
de la relación de equivalencia, con la que aquél está estrechamente 
vinculado. 
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h) Identidades del álgebra de los conjuntos 


Con ayuda de las operaciones de unión, intersección y comple- 
mentación es posible formar diversas expresiones algebraicas de 
los conjuntos. Designemos por M(X, Y, Z) cierta expresión al- 
gebraica constituida por los conjuntos X, Y y Z. Esta representa 
cierto conjunto, Sea B(X, Y, Z) otra expresión algebraica formada 
por los mismos conjuntos. Si ambas expresiones algebraicas re- 
presentan un mismo conjunto, entonces se les puede igualar una 
a otra obteniendo una identidad algebraica de la forma 


A(X, Y, Z)=B(X, Y, Z). (1-31) 


Tales conjuntos resultan sumamente útiles para las transfor- 
maciones de las expresiones algebraicas con conjuntos y en la 
sección presente estudiaremos algunos de ellos. 


Fig. 1-6. Representación geométrica de la identidad 
(X U Y) NZ = (X N 2) U (Y N Z) 


1. En la figura 1-6 se muestran los diagramas de Euler — Venn 
para las expresiones (X U Y)NZ y (XNZ)U(Y NZ). En dichos 
diagramas se ve que ambas expresiones definen un mismo con- 
junto, así pues, en el álgebra de los conjuntos tiene lugar la iden- 


idad 
(XUYNZ=(XNZ UYN Z), (1-32) 


análoga a la ley distributiva (a + b)c = ac + bc del álgebra or- 
dinaria. 

2. En el álgebra ordinaria, en la ley distributiva no podemos 
sustituir la operación de adición por la de multiplicación, y vice- 
versa, ya que esto conduce a la expresión absurda (ab)-+c= 
(a +c) do + c). No ocurre así en el álgebra de los conjuntos. 

En la figura 1-7 se muestran los diagramas de Euler — Venn 
para las expresiones algebraicas (X N Y)UZ y (X U Z)N(Y UZ). 
Ambas estas expresiones dan un mismo conjunto; por lo tanto, 
tiene lugar la identidad 


ANY UZ=(XUZINWUZ). (1-33) 
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3. Es fácil cerciorarse de que si Y = X, entonces 
XNY=Y, XUY=X. (1-34) 


En efecto, todos los elementos del conjunto Y son también a la 
vez, elementos del conjunto X. Esto significa que la intersección 
de dichos conjuntos, o sea, la parte común de los conjuntos X e Y 
coincide con Y. En la unión de los conjuntos X e Y, el conjunto Y 
no aporta ningún elemento que ya no forme parte de la misma 
alenna elemento del conjunto X. Por consiguiente, X U Y coincide 
con X. 

4. Suponiendo que en (1-34) Y = X y considerando que X = X, 
hallamos que: 

XNX=X, XUX=X. (1-35) 


En algunos casos resulta inconveniente demostrar las identida- 
des del álgebra de los conjuntos con ayuda del diagrama de 


Fig. 1-7. Representación geométrica de la identidad 
(X N Y) UZ = (X U Z) N (Y UZ) 


Euler — Venn. Existe un método más general para determinar la 
identidad de dos expresiones algebraicas. 

Sean designadas, como antes, por A(X, Y, Z) y B(X, Y, Z), 
dos expresiones algebraicas obtenidas mediante la aplicación de 
las operaciones de unión, intersección y complementación a los 
conjuntos. X, Y y Z. Para demostrar que A = B es suficiente 
mostrar que A= Y y que BE U. A su vez, para mostrar que 
A <= B, es necesario convencerse que de x= A se desprende que 
xEB. Análogamente, Nai, mostrar que B&A hace falta cer- 
ciorarse de que de x= 9 se deriva que x e 2. Utilicemos este mé- 
todo para demostrar varias identidades más. 

5. Demostremos la identidad 


XUY=Xpn7. (1-36) 


Supongamos que x = XUY, o sea, que x Æ X U Y, Esto signi- 
fica que xX y xe£Y, es decir, que xe X y x=. Luego, 
x=X(Y?. Supongamos ahora que y = X N F, o sea, yeX e 
y E Y. Esto quiere decir que y $£ Re y ÉY, o bien que y X U Y. 
Por lo tanto, ye X U Y. 
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6. Demostremos la identidad 
xXnYy=XuY, (1-37) 


reduciendo ambos miembros de la misma a igual forma. Efec- 
tuando la operación de complementación en ambos miembros de 
(1-37) obtenemos que YNY = XUP. El primer miembro de esta 
expresión da X (1 Y. Lo mismo obtenemos transformando el se- 
gundo miembro según la regla (1-36). 

En la literatura las identidades (1-36) y (1-37) comúnmente 
se denominan identidades de Morgan. 


1-3. ORDENACION DE ELEMENTOS 
Y PRODUCTO DIRECTO DE LOS CONJUNTOS 


a) Conjunto ordenado 


A la par con el concepto de conjunto, como una unión de ele- 
mentos, existe una importante noción de conjunto ordenado o cor- 
tejo. Se denomina cortejo una sucesión de elementos, o sea, una 
union de elementos en la cual cada uno de ellos ocupa un lugar 
determinado. Los propios elementos se llaman entonces componen- 
tes del cortejo (primera componente, segunda componente, etc.). 
Son ejemplos de cortejos: el conjunto de personas que están en 
una cola, el conjunto de palabras en una frase, los números que 
expresan la longitud y latitud de un punto en el terreno, etc. En 
todos estos conjuntos la ubicación de cada elemento está absoluta- 
mente determinada y no puede cambiarse arbitrariamente, 

El número de elementos del cortejo se denomina su largo. Para 
designar un cortejo vamos a emplear los paréntesis. Así pues, el 


conjunto 
a= (äp la +... An) (1-38) 


es el cortejo de largo n con los elementos a, ..., An. Los cortejos 
de largo 2 se llaman pares o pares ordenados, los cortejos de 
largo 3, tríadas, los de largo 4, cuartas, etc. En el caso general, 
los cortejos de largo n se llaman de orden n o n-arios. Constituyen 
casos particulares de cortejos el cortejo (a) de largo 1 y el cortejo 
vacío de largo O designado por ( ) o A. A diferencia del conjunto 
ordinario, en el cortejo pueden haber elementos iguales, p. ej.: dos 
palabras iguales en una frase, valores numéricos iguales de la lon- 
gitud y la latitud de un punto en el terreno, etc. 

En lo sucesivo vamos a estudiar conjuntos ordenados cuyos 
elementos son números reales. Tales conjuntos ordenados se deno- 
minan puntos del espacio o vectores. De este modo, el cortejo 
(ai, az) puede considerarse como un punto en el plano o un vector 
trazado desde el origen de coordenadas hasta el punto en cuestión 
(fig. 1-8, a). Las componentes a, y az serán las proyecciones del 
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vector sobre los ejes 1 y 2 
Pr, (a, a= a; Prela,, a) = 0. 


El cortejo (au, az, as) se puede considerar como un punto en el 
espacio tridimensional o como un vector espacial trazado del ori- 
gen de coordenadas a dicho punto (fig. 1-8, 6). Las proyecciones 
del vector sobre los ejes de coordenadas son 


Pri (a, az, a=4;, i=l, 2,3. 


Sin embargo, en el caso dado puede hablarse de la proyección 
simultánea del cortejo sobre dos ejes, por ejemplo 1 y 2, es decir, 
sobre el plano de coordenadas. Es fácil ver que dicha proyección 
constituye un cortejo de dos elementos 


Priz (41, az, an) == (a, az). 


Generalizando estos conceptos vamos a considerar el conjunto 
ordenado de números reales de n elementos (a4, ..., an) como un 


1 "oía, 42,43) 


Up -—Q(0,42) 
1 


LU 


Fig. 1-8. Proyecciones de un cortejo de dos y tres elementos 


preto en el espacio imaginario de n dimensiones llamado a veces 
iperespacio o como un vector de n dimensiones. Vamos a consi- 
derar entonces las componentes del cortejo a de n elementos como 
las proyecciones de dicho cortejo sobre los ejes correspondientes 


Prra=4, i=1l,...,n. (1.39) 

Si i, j, -.., L son los números de los ejes, siendo 1 < i < A 

<...l <n, la proyección del cortejo a sobre los ejes l, fa .s l 
es igual a: 

Pro 14=(4; aj, ..., aj). (1-40) 


La proyección del cortejo sobre un conjunto vacío de ejes cons- 
tituye un cortejo vacío 


Proa== A. (1-41) 


En el capítulo 3 se dará una definición más completa y rigu- 
rosa del espacio multidimensional. 
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b) Producto directo de conjuntos 


Se llama producto directo de los conjuntos X e Y al conjunto 
designado por X X Y que consta de todos aquellos y sólo aquellos 
paros ordenados cuya primera componente pertenece al conjunto X 
y la segunda, al conjunto Y. De esta suerte los elementos del con- 
junto ordenado constituyen cortejos de dos elementos del tipo 
(x, y). Su definición formal es 


XXY=((x,1):x8X, yeY). (1-42) 
Ejemplo 1-10. Sean X= (l, 2, Y= {1, 3, 4), Entonces XX Y = (1,1), 


(1,3). (1,4), (2,1), (2,3), (2,4)). La representación geométrica de este con- 
junto se muestra en la figura 1-9, a. 


Fig. 1-9. Representación geométrica del producto directo de conjuntos 


Binet 1-11. Sean X e Y segmentos de un eje real. El pastas directo 
xx Y se representa por el rectángulo rayado indicado en la figura 1-9,b. De 
del producto directo difieren de las 


esta figura se deduce que las propieda 
propiedades del producto ordinario en sentido aritmético. En particular, ef pro- 
ducio directo cambia ol cambiar el orden de los factores, es decir, 


XXYRAYXX. (1-43) 


La operación de multiplicación directa se extiende también 
fácilmente a un número mayor de cenpintos: Se denomina producto 
directo de los conjuntos Xy, Xa, ..., Xn el O designado por 
XX XaX ... X+ que consta de todos aquellos y sólo aquellos 
cortejos de largo r, cuya primera componente pertenece a Xi, la 
segunda, a Xa, etc. 

Es fácil ver que 


xxY=092x=09 o Y'=090, (1-44) 


ya que no existen pares ordenados con la primera o segunda com- 
ponente que falta. Análogamente, X, X X2X...X, = Ø cuando, 
y sólo cuando siquiera uno de los conjuntos Xi, Xa, ..., X, es un 
conjunto vacío. 

I concepto de potencias de un conjunto constituye un caso par- 
ticular de la operación de multiplicación directa. Sea M un con- 
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junto arbitrario. Llamemos potencia s del conjunto M y designe- 
mos por M* el producto directo de s conjuntos iguales a M: 


M=MXMX ... XM. (1-45) 
5 veces 
Esta definición sirve para s = 2, 3, ... Ella puede hacerse ex- 


tensiva a cualquier s entero no negativo si asumimos mediante 
una definición especial que 


M=M, M=(A). (1-46) 


Si R es el conjunto de los números reales, entonces Ri= R X R 
representa el plano real y R? = R X R X R representa el espacio 
tridimensional real. 


c) Proyección de un conjunto 


La operación de proyección de un conjunto está vinculada 
estrechamente a la operación de proyección de un cortejo y sólo 
quede aplicarse a los conjuntos cuyos elementos son cortejos de 
largo igual. 

Sea M un conjunto que consta de En de largo s. Entonces 
vamos a llamar proyección del conjunto M al conjunto de las pro- 
yecciones de los corlejos de M. 


Ejemplo 1-12. Sea M = (1, 2, 3, 4, 5), (2, 1, 3, 5, 5), (3, 3, 3, 3, 3), (3, 2, 3, 
4, 3) Entonces 


Pra M em (2, 1,3); Pra, « M = ((2, 4), (1,5), (3, 3)). 
Es fácil comprobar que si M = X X Y, entonces 


PiM=X; PrM=Y, (1-47) 
y si Q = X X Y, entonces 
PrQsX; PrQsY. (1-48) 


1-4. CORRESPONDENCIAS 


a) Definición de correspondencia 


Examinemos dos conjuntos X e Y. Los elementos de dichos con- 
juntos pueden compararse unos con otros de algún modo, for- 
mando pares (x, y). Si el método de tal comparación está deter- 
minado, o sea, para cada elemento x E X está indicado el elemento 
y € Y con el cual se compara el elemento x, se dice que entre los 
conjuntos X e Y se ha establecido correspondencia no siendo en- 
tonces imprescindible en lo absoluto que participen en la compa- 
ración todos los elementos de los conjuntos X e Y. 
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Para presentar una correspondencia es necesario señalar: 

1) el conjunto X cuyos elementos se comparan con los elemen- 
tos del otro conjunto; 

2) el conjunto Y cuyos elementos se comparan con los elemen- 
tos del primer conjunto; 

3) el conjunto Q =X X Y que define la ley en conformidad 
con la cual se realiza la correspondencia, o sea, que enumera todos 
los pares (x, y) participantes en la comparación. De este modo, 
la correspondencia designada por q representa la tríada de con- 


juntos 
q=(X,Y, Q), (1-49) 


en la cual Q = X X Y. En esta expresión, la primera componente X 
se llama dominio de partida de la correspondencia, la segunda 
componente Y, dominio de llegada de la correspondencia, y la ter- 
cera componente Q, gráfica de la correspondencia. El término “grá- 
fica” se explicará más detalladamente al estudiar el tipo particular 
de correspondencia denominada función, 

Además de los tres conjuntos examinados X, Y, Q, también 
están relacionados indisolublemente con cada correspondencia los 
dos conjuntos siguientes: el conjunto PriQ llamado dominio de 
definición de la correspondencia, formado por los elementos del 
conjunto X que entran en comparación y el conjunto PraQ llamado 
dominio de valores de la correspondencia, constituido por los ele- 
mentos del conjunto Y que entran en comparación. 


Si (x,y) =Q, se dice que el elemento A corresponde al elemento x. Es 
cómodo representar esto geométricamente mediante una flecha dirigida de x a y. 


a b ca b +. 

PS i 
o PS 

E NE E Y 
a) b) 

Fig. 1-10. Representación geométrica de las correspondencias directa e inversa 


Ejemplo 1-18. Sean X = {1,2}, Y = (3,5) de manera que X X Y = ((1, 3), 
(1,5), (2,3), (2,5)). Este conjunto da la posibilidad de obtener 16 corresponden- 
cias diferentes, Cilemos algunas de ellas: 
Qu= (1,3) Pri Quill Pra Qu= (8h; 
Q= (1,3), (0,5) PriQu=ÚIlh Pri Q= (3,5) =Y. 

Ejemplo 1-14. En una empresa hay tres vehículos automóviles, dos camio- 
nes a y f que trabajan en dos turnos y un autobús y raramente utilizado. El 
camión f se encuentra en reparaciones. En la plantilla hay tres chóferes a, b, € 


de les cuales c está de vacaciones. La distribución de los chóferes por vehiculos 
constituye una correspondencia. Una de las correspondencias posibles será la 


siguiente: 
a=((a, b, c), (a, $, y), (a, a), (a, y), (b, aj). 
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Esta correspondencia está representada geométricamente en la figura 1-10, a. 
En ella el elemento œ corresponde a los elementos a y b, y el elemento ¿y. al 
elemento a. La correspondncia g está definida para a y b, pero no lo está para 
.£, por consiguiente, el dominio de definición de la correspondencia es el con- 
Junto (a, 6). El dominio de valores de la correspondencia es el conjunto (a, y). 


b) Correspondencia inversa 


Para cada correspondencia q =(X, Y, Q), QS&X XY existe 
una correspondencia inversa que se obtiene si se considera la co- 
rrespondencia dada en dirección contraria, es decir, si se determi- 
“nan los elementos x Æ X con los cuales se comparan los elemen- 
tos y ez Y. La correspondencia inversa a la correspondencia g será 


designada por 
di =(Y1,Xx,Q 


«donde Q~! = Y X X. 

Ejemplo 1-15, Para el ejemplo 1-14 la correspondencia inversa será la dis- 
tribución de los vehículos entre los chóferes; 

(ía, P, y) (a, b, c}, f(a, a), (a, b), (y, a))), 

lo que sẹ muestra geométricamente en la figura, 1-10 b, 
En el ejemplo dado se ve que la representación geométrica de 
la correspondencia inversa se obtiene cambiando la dirección de 
"las flechas en la representación geométrica de la correspondencia 
directa. De ello se desprende que la correspondencia inversa de la 
«correspondencia inversa será la correspondencia directa 


Ñ (yq. (1-51) 


(1-50) 


€) Composición de correspondencias y 


Se llama composición de correspondencias al empleo consecu- 
tivo de dos correspondencias. 

La composición de correspondencias es una operación con tres 
conjuntos X, Y, Z, en los cuales están definidas dos corresponden» 


cias! * - 
q==(X, Y, Q), A) 
> “P=, Z, Pi- PSYXZ, 


por cierto, el dominio de valores de la primera correspondencia 
coincide con el dominio de definición de la segunda 


a iig PrQ=Pr, P. (1-53) 


La primera correspondencia define para cualquier x = Pr,Q 
cierto eleménto y Œ Y que además puede ser no único. De:acuerdo 
con la. definición de la operación de composición de corresponden- 
cias, ahora hace falta definir la z Æ Z para la y e Y hallada, em- 
pleando la segunda correspondencia. De este modo, la composición 


ys 


(1-52) 


de correspondencias compara con cada elemento x del dominio de 
definición de ta primera correspondencia PriQ, uno o varios ele- 
mentos del dominio de valores de la segunda correspondencia 
PraP. z 

Vamos a designar por q(p) la composición de correspondencias 
a y p, y por QeP, la gráfica de la composición de corresponden- 
cias. Entonces la composición de correspondencias (1-52) se es- 
cribe en la forma 


qip) =Y, Z,QoP), QoPSZXXLZ. (1-54) 


Elemplo 1-16. Si q es la correspondencia que determina la distribución de 
los chóferes por vehículos automóviles y p, la correspondencia que determina 
la distribución de vehículos por rutas, entonces la correspondencia q(p} es la 
correspondencia que define la distribución de chóferes por rutas. 

:, Como es lógico, la operación de composición puede extenderse 
asimismo a un número de correspondencias mayor de dos. 


1-5, REFLEJOS Y FUNCIONES 


a) Reflejos y sus propledades 


+ Sean X e Y ciertos conjuntos siendo F =X X Y y Pri l = X. 
La tríada de conjuntos (X, Y, T) define cierta correspondencia que 
posee la propiedad de que su dominio de definición Pr, T coincide 


a b 


8 
=< p Y? 
Fig. 1-11. Representación geométrica del reflejo 


con el dominio de partida, es decir, con X, y, por lo tanto, dicha 
correspondencia está definida en todas partes en X. En otras pa- 
labras, para cada xe X existe una y e Y tal que (x, y) T. Tal 
correspondencia definida en todas partes se denomina reflejo de X 
en Y y se expresa por 

TP: X>Y. (1-55) 


A menudo por la palabra “reflejo” se comprende el reflejo uni- 
voco. Sin embargo, nosotros no vamos a atenernos a ésta regla y 
consideraremos que el reflejo T pone en correspondencia con cada 
elemento x = X cierto subconjunto 


Px=Y. (1-56) 


llamado imagen del elemento x. La ley conforme a la cual se 
realiza la correspondencia se define por el conjunto F. 


xy 


Ejemplo 1-17. Si en el ejemplo 1-14 se excluye del análisis el chófer c, se 
obtiene el reflejo F: X-» Y, en el cual X = {a, bf es el conjunto de los chófe- 
ses: K m {æ BY), el conjunto de los vehículos automóviles, y T = ((0,0), (a 
Vuelha} la distribución de los chóleres por vehiculos. En la figura 1-11 se 
muestra la representación geométrica de este reflejo. 


Examinemos algunas propiedades del reflejo. Sea A S X. Para 
cualquier x & A el conjunto Tx < Y será la imagen de x. El total 
de los elementos de Y que constituyen imágenes de Tx para todas 
las x = A se denomina imagen del conjunto A y se designa por PA. 
Según esta definición 


TA= y Tx. (1-57) 


Si A, y Az son subconjuntos de X se cumple que 
T(A,UA)=TA UTA». (1-58) 
En efecto, 
T(AU a Ya CY, ru Y, = FA, UTA 


Sin embargo, la relación 
T (AN A) =TA NTA (1-59) 


sólo es válida en caso de que el reflejo sea univoco. Para demos- 
trar esto realizaremos el fraccionamiento de los conjuntos A, y Az 
(fig. 1-12) del tipo 


A =X¡UXo A= XU Xo 


donde Xo = A; N Az. 
CDi 


Fig. 1-12. Fraccionamiento de conjuntos intersecados 


Por cierto, los conjuntos Xı, X2, Xo serán fraccionamientos del 
conjunto A, U Az. Aunque dichos conjuntos no son incidentes, sus 
imágenes, sin embargo, pueden tener elementos comunes en caso 
de no ser unívoco el reflejo. Por consiguiente, 


PATA =P (X,UXANT(X2U X) = 
= (PX A TXa) U (TX, ATX) U (MXN PX) UTX. 


En esta relación se ve que (1-59) sólo se cumple en el caso de 
que 
PXNTX.= 


1R=(0,1,2% ¿%k, (1-60) 
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es decir, cuando el reflejo es univoco. Ahora bien, en el caso ge- 
neral 


TX =T (A, NA) S TA, NTA. (1-61) 
Las relaciones obtenidas se generalizan también con facilidad 
para un número mayor de conjuntos A;. Así pues, si Ai, ..., An 


son subconjuntos de X, entonces 
r (0 4) = Uras (1-62) 


r(á Ar s (ra. (1-63) 


Por cuanto el reflejo constituye un caso particular de corres- 
pondencia, son válidos para el esto los conceptos de reflejo in- 
verso y composición de reflejos, análogos a los conceptos introdu- 
cidos al estudiar las correspondencias. 


b) Reflejos presentados en un conjunto 


El caso en que coinciden los conjuntos X e Y es un importante 
caso particular de reflejo. En tal caso el reflejo I: X ->X va a 
representar el reflejo del conjunto X sobre sí mismo y va a defi- 


nirse por el par 
aT (1-64) 


en el cual F & X?. La teoría de los grafos, cuyos elementos serán 
examinados en el capítulo 2, se ocupa del estudio detallado de 
tales reflejos. Aquí sólo nos referiremos a ciertas operaciones con 
semejantes reflejos. 

Sean T y A los reflejos del conjunto X en X. Vamos a deno- 
minar composición de dichos reflejos el reflejo PA que en concor- 
dancia con la regla expuesta en el $ 1-4 se define de la manera 


siguiente: 
(PA) x=T (Ax). (1-65) 
En el caso particular en que A = I, obtenemos los reflejos 
P%=T(Px) (1-66) 
Tx =P (T?x), etc. (1-67) 


De este modo, en el caso general para cualquier s > 2 se ve- 
rifica 


Px=r(r y). (1-68) 
Mediante una definición especial introduzcamos la relación 
Px=x. (1-69) 
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Ello da la posibilidad de extender la relación (1-68) también 
a las s negativas. Efectivamente, según (1-68) 


P'r=r (=r k= (1-70) 


Esto significa que -tx constituye un reflejo inverso. Entonces 


Træ r' (r'r), (1-71) 
etc. 


Ejemplo 1-18, Sea X un conjunto de personas, Para cada persona èe X, 
designemos por Fx el conjunto de sus hijos. Entonces I%x es el conjunto de 
los nietos de x; Tx, el conjunto de los biznielos de x; Tix, el conjunto de los 
padres de x, etc. 

Representando las personas por puntos y trazando las flechas que van 
de x a Fx, obtenemos el árbol genealógico que se muestra a título de ejemplo 
en la figura 1-13. 


é 


rz 


Fig. 1-13. Arbol genealógico 


Ejemplo 1-19. Analicemos un juego de ajedrez. Designemos por x cierta 
osición (ubicación de las figuras en el tablero), que puede crearse durante el 
juego, y por X, el conjunto de las posiciones posibles. Entonces, Fx va a sig- 

nificar para cualquier x= X el conjunto de posiciones que pueden obtenerse 

a partir de x haciendo una jugada y cumpliendo las reglas del juego. En tal 

caso, 

Fx = 8, sl x es una posición de jaque mate o de tablas; 

T3x es el conjunto de las posiciones que pueden obtenerse a partir de x 
con tres jugadas; 

T-'x es el conjunto de las posiciones a partir de las cuales puede obtenerse 

la posición dada con una jugada. À 


Para los reflejos presentados en un conjunto, con frecuencia se 
utilizan algunas otras denominaciones que se encontrarán más 
adelante en nuestra obra. 

Así pues, si los elementos x = X representan los estados de un 
sistema dinámico, el reflejo Px puede considerarse como el con- 
junto de los estados a los cuales puede pasar el sistema partiendo 
de un estado dado. En' este caso lo más apropiado es utilizar el 
término transformación del estado del sistema dinámico. Para 
designar ciertos tipos especiales de reflejos presentados en un 
mismo conjunto, también se emplea el término relación. 
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c) Función, funcional y operador 
Examinemos cierto reflejo 
f: X=Y. (1-72) 


Este reflejo se denomina función si es univoco, es decir, si para 
cualesquiera pares (xı, 4M1)Ef y (xa, ya)Ef de x2= xı se des- 
prende que Ja = yı- 

De la definición de reflejo y de los ejemplos dados anterior- 
mente se deduce que los elementos de los conjuntos X e Y pueden 
ser objetos de cualquier naturaleza. No obstante, en los problemas 
de cibernética presentan gran interés los reflejos que son unívocos 
y cuyo conjunto de valores es el conjunto de los números reales R. 
El reflejo unívoco f definido por (1-72) se denomina función con 
valores reales si Y S R. 


X = (tr, aut, av), Y = (7, 9, 12). 


La función f: X— Y, obtenida de las condiciones del ejemplo, puede escri- 
birse en forma del conjunto f {{tr-, 7), awt, 9), (av., 12)} 


El valor y en cualquiera de los pares (x, y)ef se denomina 
función de la x dada, escribiéndose en la forma y == f (x). Tal no- 
tación permite introducir la siguiente definición formal de función: 

=i y) SXXY:y=Hx0). (1-73) 

De esta suerte, el simbolo f se utiliza para la definición de la 
función en dos sentidos: 

. 1) f es el conjunto cuyos elementos son los pares (x, y) que 
participan en la correspondencia; 

> 2) f(x) es la designación para la y E Y correspondiente a la 
xEX dada. 

La definición formal de función a modo de la relación (1-73), 
permite establecer los métodos de presentación de la función. 

1. La enumeración de todos los pares (x, y) que constituyen el 
conjunto f, como se hizo en el ejemplo 1-20. Tal método de presen- 
tación de la función es aplicable si X es un cojunto finito. Para 
mayor claridad conviene disponer los pares (x, y) en forma tabu- 
ar, 

2. En muchos casos, tanto X como Y constituyen conjuntos de 
números reales o complejos. En tales casos, muy frecuentemente se 
comprende por f(x) la fórmula, es decir, la expresión que contiene 
la relación de las operaciones matemáticas (adición, substracción, 
división, logaritmación, etc.), que hay que realizar con x & X para 
obtener “y. k 

Ejemplo 1-21. Sean X=Y=R y [=((%,4) E Rè: y =x). Entonces 
fix) = è, 
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A veces resulta necesario emplear distintas fórmulas para los 
diferentes subconjuntos del conjunto X de la función. Sean Ay, ... 
s., An los subconjuntos de X que no se intersecan por pares. 
Designemos por f(x) (i = 1,..., n) la fórmula que define y sien- 
do x E As. Entonces la función f(x) va a definirse por la expresión 


h 0) para xe Aj; 
( A A (1-74) 
falx) para x= A. 


Asi, la función y = f(x)= |x| puede presentarse en la forma 


f { x para x>0; 
a Er para x <0. 


F= 


3. Si X e Y son conjuntos de los números reales, los elementos 
(x, y) Ef pueden representarse en forma de puntos en el plano R?. 
La totalidad de dichos puntos va a constituir la gráfica de la fun- 
ción f(x). En la figura 1-14, a está representada la gráfica de la 
función dada en el ejemplo 1-21. 


Fiz) z 
+ pa 
z t 
a) (2 


Fig. 1.14. Gráficas de funciones 


En los problemas de cibernética con mucha frecuencia se hace 
necesario operar con funciones del tiempo. Estas funciones definen 
el reflejo de un número finito o infinito de puntos de cierto inter- 
valo de tiempo T en el conjunto de números reales X Æ R, lo que 
puede escribirse en la forma 


fT. (1-75) 


Designando por t los elementos del conjunto T, y por x los 
elementos del conjunto X, obtenemos la función x = f(1), que de- 
termina el carácter de la variación del valor de x en el tiempo, 
como se muestra por ejemplo, en la figura 1-14, b. Para simplificar 
la notación vamos a designar simplemente por x(t) la dependencia 
de x del tiempo. 

Si en la expresión (1-72) X = U X V, entonces llegamos a la 
función de dos variables u y v, designada por f (u, v), donde ue U 

vÆ V. La definición formal de la función de dos variables rea- 
lestscrálla siguiente: 


f= {(u, v, y) EU XV XY : y= f (u, 0) (1-76) 
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De manera análoga se definen las funciones de tres o un nú- 
mero mayor de variables. 

Por cuanto la función es un caso particular de correspondencia, 
para ella serán válidos los conceptos de función inversa y compo- 
sición de las funciones, como los expuestos para la corresponden- 
cia. Si f y g son dos funciones en el conjunto R?, siendo 


f:X=>Y g:Y>Z, (1-77) 
entonces las funciones inversas serán: 
F':Y>x g :z>Y. (1-78) 
La composición de las funciones f y g 
fog:X>Z (1-79) 
define para cada x= Z una z € Z que se designa como 
z= (f° g) x= g IH). (1-80) 


El concepto de funcional es un concepto más general que el de 
función. La funcional establece la dependencia entre un conjunto 
de números, por un lado, y cierto conjunto de funciones, por otro 
lado, Puede servir de ejemplo de funcional la integral definida del 
tipo = 

I= | f) dx. 


Como vemos, la funcional J(f) representa un número depen- 
diente de la función f(x), la cual se elige de cierto conjunto pre- 
sentado de funciones. 

El concepto de operador es un concepto aún más amplio, El 
operador establece la correspondencia entre dos conjuntos de fun- 
ciones de tal modo que a cada uno de éstos corresponde una fun- 
ción determinada del otro conjunto: Así pues, si designamos por p 
el operador de diferenciación, la relación entre la derivada f boy 
= df (x)/dx y la función f(x) puede escribirse en forma de la re- 
lación Operacional 

P w= pl eN. 


1-6. RELACIONES 


a) Relación como representación del enlace mutuo 
entre los fenómenos 


Hasta ahora hemos considerado los conjuntos simplemente 
como una reunión de elementos. En los ejemplos dados hemos visto 
que pueden ser elementos de los conjuntos los objetos y fenómenos 
más diversos de la naturaleza, la técnica y la sociedad, e incluso 
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de la vida cotidiana. Estos objetos y fenómenos poseen las más di- 
ferentes propiedades. Pero, al estudiar los conjuntos como reunión 
de clementos nos hemos “abstraído de todas las propiedades de 
dichos elementos salvo una: ser elementos del conjunto conside- 
rado. 

Tal enfoque resulta sumamente provechoso ya que permite in- 
troducir un método único de descripción de los fenómenos de más 
diverso tipo. Pero este enfoque en muchos casos es a la vez unila- 
teral e insuficiente. 

En la naturaleza y la sociedad los diferentes sucesos y fenó- 
menos no existen por sí mismos, sino que están vinculados recipro- 
camente e influyen unos sobre otros. En el concepto de conjunto 
no se refleja este enlace mutuo de los fenómenos. Es por ello que 
el concepto: de conjunto requiere su desarrollo ulterior para apro- 
ximarse a la descripción de las situaciones reales. 

El primer paso en este sentido es la introducción del concepto 
de relación en el conjunto que constituye el método matemático de 
expresión del enlace mutuo entre Jos fenómenos. El concepto de 
conjunto obtiene su desarrollo posterior en los espacios multidi- 
mensionales al estudio de los cuales está dedicado el tercer ca- 
pitulo, 


b) Propiedades de las relaciones 


Como ya se ha indicado, el término “relación” se emplea para 
designar algunos tipos de reflejos dados en un mismo conjunto. 
Debido al uso de este término es conveniente introducir una serie 
de símbolos especiales. 

Supongamos que cl reflejo (X, F) es una relación. Examinemos 
el elemento y € Fx, Diremos que el elemento y se encuentra en 
relación T con el elemento x y lo escribiremos en la forma 


grx. (1-81) 


Asi pues, el símbolo F en el ejemplo 1-18 denota la relación 
“ser hijos de la persona dada”. 

Nota. Utilizando para el reflejo dado en un conjunto la corre- 
lación (1-64), obtenemos que la relación es el par de conjuntos 
(X, T) en el cual T S X?. Por cuanto los elementos del conjunto X2 
son pares ordenados puede decirse que la relación es un conjunto 
de pares ordenados. Como que cada par relaciona entre sí sólo 
dos elementos del conjunto A?, esta relación se denomina a veces 
relación binaria o de dos lugares. 

Puede introducirse un concepto de relación más general deno- 
minando relación el par de conjuntos (X, T), donde T <=X». Los 
elementos del conjunto X” son las n-es ordenadas y esto permite 
denominar n-aría o de n lugares la relación dada. En particular, 
el conjunto de las triadas ordenadas puede llamarse relación ter- 
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naria o de tres lugares. En lo adelante, sin especificarlo especial- 
menle, con el término “relación” nos referiremos a la relación 
binaria. 

Las relaciones se dividen en diferentes clases dependiendo de si 
poseen o no ciertas propiedades. 

Examinemos las seis propiedades principales de las relaciones. 
Al exponer dichas propiedades vamos a considerar que x, y, 2 son 
elementos cualesquiera del conjunto X. 

Reflexividad: xPx es cierto; antirreflexividad: xx es falso; si- 
metria: xTy >yTx; antisimetría: xTy y ylx>x asimetría: 
si xT'y es cierto, entonces yT'x es falso; transitividad: xPy y yrz > 
=> XTZ. 

Examinemos algunas clases importantes de relaciones, utili- 
zando las propiedades expuestas. 


c) Relación de equivalencia 


Algunos elementos de un conjunto pueden considerarse equi- 
valentes, cuando, en algunos casos, al someterlos a cierto análisis, 
uno de ellos puede 'ser sustituido por otro. Entonces se dice que 
los elementos dados están en relación de equivalencia. 

Ejemplos de relaciones de equivalencia: 

la relación “estar en un curso” en el conjunto de los estudian- 
tes de una facultad; 

la relación “tener igual resta al dividirse por 3” en el conjunto 
de los números enteros positivos; 

i la relación de paralelismo en el conjunto de las rectas de un 
ano; 
p la relación de semejanza en el conjunto de los triángulos, etc. 

Para formular con exactitud la relación de equivalencia vamos 
a considerar que el término “relación de equivalencia” se emplea 
solamente en caso en que se cumplen las tres condiciones siguien- 
tes: 

3 cada elemento es equivalente a st mismo; 

2) la proposición de que dos elementos son equivalentes no 
requiere que se precise cuál de los elementos se considera primero 
y cuál segundo; 

3) dos elementos equivalentes a un tercero son equivalentes 
entre sí. 

Adoptemos el símbolo == para denotar equivalencia. Entonces 
la definición general de equivalencia se obtiene escribiendo las 
tres condiciones citadas anteriormente en forma de las relaciones 
siguientes: 

1) x = x (reflexividad); 

2) x = y >y = x (simetría); 

3) x= y e y = z > x = 2 (transitividad). 

Así pues, la relación F se denomina relación de equivalencia 
si es reflexiva, simétrica y transitiva. 


ES 


La relación de equivalencia está vinculada estrechamente al 
fraccionamiento de conjuntos estudiado en el $ 1-2. Sea X un con- 
junto en el que está definida la relación de equivalencia. Por 
ejemplo, X es el conjunto de estudiantes en un curso y la relación 
de equivalencia es “estar en un grupo”. Llamaremos clase de 
equivalencia al subconjunto de elementos equivalentes a cierto ele- 
mento x= X. Así pues, el grupo en que cursa estudios el estu- 
diante Ivanov será la clase de equivalencia que equivale al estu- 
diante mencionado. 

Sea J cierto conjunto de índices. Designemos por {4S X: je 
€ J} el conjunto de clases de equivalencia para el conjunto X. Evi- 
dentemente, todos los elementos de una clase de equivalencia son 
equivalentes entre sí (propiedad transitiva) y cualquier elemento 
x E X puede estar en una y sólo una clase. Pero en tal caso X es 
la reunión de los conjuntos no intersecados A; y de este modo el 
sistema completo de clases {4; S X : j & J} constituye el fracciona- 
miento del conjunto X. Asi pues, a cada relación de equivalencia 
en el conjunto X corresponde cierto fraccionamiento de éste en 
clases Aj. 

La relación de equivalencia en el conjunto X y el fracciona- 
miento del mismo en clases se denominan configados si paraxey 
cualesquiera la relación x = y se cumple cuando, y solo cuando x 
e y pertenecen a una misma clase A, de este fraccionamiento. 
La comparación de los ejemplos de la sección presente con los 
ejemplos del $ 1-2 coadyuvará a esclarecer con más exactitud el 
vínculo de la relación de equivalencia con el fraccionamiento del 
conjunto. 

En calidad de símbolo general de la relación de equivalencia 
se utiliza el símbolo = (a veces ~). No obstante, para algunas 
relaciones de equivalencia particulares se emplean otros símbo- 
los: = para designar igualdad; || para denotar paralelismo; == 
para designar equivalencia lógica. 


d) Relación de orden 


Con frecuencia encontramos relaciones que definen cierto orden 
de disposición de los elementos de un conjunto. Por ejemplo, dis- 
tinguimos los conceptos “antes” y “después” en aquellos casos en 
que los elementos del conjunto Son estados de un sistema diná- 
mico. Diferenciamos los conceptos “es menor que” y “es mayor 
que” y utilizamos los símbolos > o < si los elementos del con- 
junto son números. Distinguimos los conceptos de conjunto y sub- 
conjunto empleando los simbolos = o <. 

En todos estos casos los elementos del conjunto X o los grupos 
de elementos pueden disponerse en cierto orden, es decir, puede 
introducirse la relación de orden en el conjunto X. 

Se distingue la relación de orden no estricto para la que se 
utiliza el símbolo < (siendo sus casos particulares los símbo- 
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los <, =) y la relación de orden estricto para la cual se emplea 
el símbolo < (siendo sus casos particulares los símbolos <, 
<=, >). Describamos estas relaciones enumerando sus propiedades. 

Se denomina relación de orden no estricto la que posee las 
tres propiedades siguientes: 


x< x es cierto (reflexividad); 

x<yey<x->x= y (antisimetria); 

xQ yey Qz x <z (transitividad). 

Se llama relación de orden estricto a la que tiene las tres pro- 
piedades siguientes: 

x<x es falso (antirreflexividad); 

x<ye y<x se excluyen mutuamente (asimetria); 

xZye y<z>x<z (transitividad). 


El conjunto X se denomina ordenado si dos elementos cuales- 
quiera x e y del mismo son comparables, es decir, si para ellos 


x<y o x=y o y<x. 


€) Relación de predominio 


En aquellos casos en que X denota un conjunto de personas 
o de grupos de personas, nos encontramos con una relación que es 
de predominio. Diremos que x predomina sobre y y escribiremos 
x< y si x supera en algo a y. Así, x puede ser un deportista 
o equipo deportivo que venció al deportista o equipo y, o una 
persona que goza de autoridad ante la persona y, o una propiedad 
que se prefiere a la propiedad y. 

Diremos que entre los elementos del conjunto X hay relación 
de predominio si dichos elementos tienen las dos propiedades 
siguientes: 

1) ningún individuo puede predominar sobre sí mismo, es decir, 
x>> x es falso (antirreflexividad); 

2) en cada par de individuos es seguro que un individuo pre- 
domina sobre otro, o sea, x<<y e y<<x se excluyen mutuamente 
(asimetría). 

Respecto al predominio la propiedad de transitividad no se 
cumple. En efecto, si en unas competencias el equipo x venció al y 
y el y derrotó al 2, de esto no se deduce que el equipo x vencerá 
necesariamente al z. 


1-7. ALGUNOS CONCEPTOS DE ALGEBRA SUPERIOR 
a) Grupos, anillos y campos 


Las operaciones algebraicas (adición, multiplicación y divi 
sión) que fueron introducidas inicialmente para los números racio- 
nales, durante el proceso de desarrollo de las matemáticas fueron 


exlendidas a otras nociones diferentes: números complejos, vecto- 
res, matrices, etc. Las “eglas de ejecución de estas operaciones son 
distintas para las diferentes nociones. No obstante, dichas opera- 
ciones tienen propiedades comunes cuyo conocimiento permite de- 
terminar si cs posible o no emplearlas para cualquier tipo concreto 
de nociones. El establecimiento de tales propiedades conduce a los 
conceptos de operación, grupo, anillo y campo algebraicos. 

Sea X cierto conjunto. Se dice que en el conjunto X está pre- 
sentada una operación algebraica si con cada par ordenado 
(a, b)= X? está puesto en correspondencia de manera unívoca un 
elemento determinado c que pertenece al mismo conjunto X. La 
operación definida de este modo se denomina multiplicación o adi- 
ción y se escribe en la forma 


e=ab o c=a +b. (1-82) 


La operación algebraica se denomina asociativa si para 
a, b,c E X cualesquiera se cumple la correlación 


(ab) c= abc) o (a+ bh +e=a + (b+ c). 


Se denomina semigrupo el conjunto X con una operación aso- 
ciativa presentada en el mismo (llamémosla por ahora multiplica- 
ción). j semigrupo se denomina grupo si: 

1) en el conjunto X existe un elemento e tal que para cualquier 
a € X se verifica 

3 (1-83) 


2) para cualquier a = X existe un elemento a~ tal que 
aa! = aa =e. (1-84) 


El elemento e se denomina unidad del grupo y el elemento a-!, 
inverso de a. Si la operación definida en el grupo se denomina adi- 
ción, entonces el elemento e se llama cero del grupo y se designa 
por el símbolo O y el a“! se denomina opuesto de a y se designa 
—a. Los elementos 0 y —a satisfacen las relaciones 


a+0=0+a=a, a+ (—a=0. (1-85) 


El grupo se denomina finito si X es un conjunto finito. Son 
ejemplos de grupos: el conjunto de los números enteros respecto 
a la operación de adición; el conjunto de todos los, números racio- 
nales diferentes de cero respecto a la operación de multiplicación; 
el conjunto de todos los vectores en el plano respecto a la opera: 
ción de adición vectorial. Sin embargo, los números enteros no 
forman grupo respecto a la operación de multiplicación ya que 
para un número entero distinto de +1 no existe un número entero 
inverso del mismo. El conjunto (1, —1, i, —i}, donde i = Y —1 
puede servir de ejemplo de grupo finito respecto a la operación de 
multiplicación. 


58 


ae = ea = 


Si en el conjunto X están definidas a la vez dos operaciones 
algebraicas, la adición y la multiplicación, siendo conmutativa Ja 
operación de adición (a -+ b = b + a), y estando la operación de 
multiplicación vinculada a la de adición mediante las leyes distri- 
butivas 

alb+o=0ob+ac y (b+oja=ba+ca, (1-86) 


entonces tal conjunto se denomina anilio. En el anillo pueden fal- 
tar la unidad y (os elementos inversos Si en El hayla unidad, em 
tonces se denomina anillo con unidad. Son anillos los conjuntos 
de todos los números enteros, racionales, reales y complejos, res- 
pecto a las operaciones comunes de adición y multiplicación. 

Se denomina campo al anillo en el gue para elementos cuales- 
quiera a 0 y b existe precisamente un elemento x tal que 
ax = b. El elemento x se denomina cociente de la división del 
elemento b por el a y se designa por x == b/a. Sirven de ejemplos 
de campos el anillo de todos los números racionales, el anillo de 
toros los números reales y el anillo de todos los números com- 
plejos. 


r b) Isomorfismo. Homomorfismo, Simulación 

La simulación de sistemas y situaciones existentes en el mundo 
real juega gran papel en las investigaciones científicas y prácti- 
cas. La esencia de Ja simulación consiste en establecer una rela- 
ción de equivalencia entre dos sistemas, cada uno de los cuales 
puede existir en realidad o ser abstracto. Si el primero resulta 
más sencillo para la investigación que el segundo, es posible 
juzgar sobre las propiedades del segundo sistema observando el 
comportamiento del primero. En este caso el sistema empleado 
para la investigación se denomina modelo, 

El modelo se denomina ¡somórfico (de igual forma) si entre el 
modelo y el sistema real se observa una correspondencia total de 
elementos. Dicha correspondencia tiene lugar entre el negativo y la 
imagen obtenida del mismo, el dibujo y la pieza elaborada según 
éste, los procesos en un sistema real y la solución de la ecuación 
que describe su comportamiento. 

Sin embargo, en muchos casos los modelos isomórficos resul- 
tan demasiado complicados e incómodos para su utilización prác- 
tica. Resultan más apropiados aquellos que permiten juzgar sola- 
mente acerca de los aspectos esenciales del comportamiento de los 
sistemas reales sin detallarlos. Puede servir de ejenplo el si- 
guiente modelo: el mapa geográfico con respecto al sector de la 
superficie terrestre representada en éste. 

Se llaman homomorfos los modelos, algunos de cuyos elemen- 
tos sólo corresponden a grandes partes del sistema real y en los 
cuales falta la correspondencia total entre los elementos “del mo- 
delo y del sistema 
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Puede darse una definición matemática rigurosa del isomor- 
fismo y homomorfismo en términos de la teoria de los grupos. 

Supongamos que los conjuntos X e Y son grupos. Si entre los 
elementos de dichos grupos se ha establecido una correspondencia 
biunívoca, según la fal para elementos cualesquiera a, b = X 
elementos correspondientes a ellos a”, b’ & Y, al elemento c = al 
va a corresponder el elemento c” = a'b”, denominándose a tales 
grupos isomórficos. 

„œs grupos isomórficos pueden diferir unos de otros sólo por 
la naturaleza de sus elementos y quizás por la denominación de 
las operaciones definidas en el grupo. Pero todas las propiedades 
de los grupos isomórficos entre sí que se derivan de las propieda- 
des de las operaciones definidas en ellos y que no dependen de la 
naturaleza de los elementos del grupo son iguales. 

En los grupos homomórficos la correspondencia entre grupos 
es unilateral. Se dice que el grupo X está reflejado homomórfica- 
mente en el grupo Y si a cada elemento del grupo X corresponde 
un elemento determinado unívocamente del grupo Y, y si a los 
elementos a,b X corresponden los elementos a”, b’ E Y, enton- 
ces al elemento ab = c corresponde el elemento c” = a'b’, En lo 
general, en caso de homomorfismo del tipo X -> Y pueden pasar al 
elemento considerado del grupo Y diversos elementos del grupo X 
y puede asimismo no pasar ninguno. 


PROBLEMAS PARA EL CAPITULO 1 


1-1. ¿Qué representa el conjunto Y \ X del ejemplo 1-12 
signar mediante rayado el conjunto YN X del ejemplo 1-3. 
13. Sea R un conjunto de números reales y 


X=(rSeR:0Cx<G1, Y=(ysR:0<y<2) 


è Qué representan los conjuntos XUY, XNY, XN Y? 
1-4, Dibujar las figuras que representan los conjuntos A =((x, y) e Rè: 
ixt HyS I) y Bal y) e R? ixt t (y PS 
¿ Qué figuras representan los conjuntos AUB, ANB, RIN A? 
1-5: Demostrar las identidades XNØ=Ø XUØ=X, INX=X 
1UX =Í utilizando la correlación (1-34). 

1-6, Representar en el plano real Rè = R X R los conjuntos XX Y e Y XX 
del problema 1-3, 

1.7. Representar geométricamente los conjuntos AXR y RXA, donde 


= (2, 3. 

qu S Gollar Prodi y PriM para el conjunto M = (2,9) ER: (+—2)* + 
1-9. Sea I = (xi, xa, xs} un conjunto universal y X = {x1 xa); Y = (xa, žo) 

Z = (xs) sus subconjuntos. Determinar enumerando los conjuntos siguientes: 


XXX; ZXZ; XXY; YXX; XXYNYXX; XXYUYXX. 


1-10. Sean X, Y, Z los subconjuntos del conjunto R? iguales a X == ((x, y) 
ix 0); Y= ((x, 9) :y S0); Z= { (x,y) :x + y > 1). Representar geométrica- 
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mente los conjuntos 
X; Y; Z; XUY; XUY; XNY; XAY, XNZ; XNZ; 
XNYNZ; xnYnz. 


1-11, ¿A qué es igual el conjunto XX Y si X e Y son subconjuntos del 
conjunto ke y X= ley Cae ih O e lll ce Y 
1-12, Escribir en el ejemplo 1-13 todas las 16 correspondencias. Determinar 
PriQ y Pr:Q para cada una de ellas. 
1:13. Hallar la función inversa f-t para la función f del ejemplo 1-21. 
1-14, Sean f y g las funciones en el conjunto R? iguales a f =((x,4): 
14y:X?h g =((y,2) : 2 = sen y). Hallar la composición de estas funciones 
ES 


Capítulo segundo 


FUNDAMENTOS 
DE LA TEORIA 
DE: LOS. GRAFOS 


2-1. DEFINICIONES FUNDAMENTALES DE LA TEORIA 
DE LOS GRAFOS 


a) Definición de grafo según la teoria de conjuntos 


Se puede obtener una representación clara del grafo si nos 
imaginamos cierto conjunto de puntos del plano X denominados 
vértices y el conjunto de segmentos dirigidos U llamados arcos 
que unen todos o algunos de los vértices. Matemáticamente, el 
grafo G puede definirse como el par de conjuntos X y U: 


G=(X, U). (2-1) 


En la figura 2-1 está representado el grafo cuyos vértices son 
los puntos a, b, c, d, e, g, h, sus arcos, 105 segmentos (a, a), 
(c, b), (c, d), (d, c); (d, d), (c, e), (e, d), (g, h). Son ejemplos de 

rafos las relaciones de paternidad y maternidad en un conjunto 
le personas (véase la fig. 1-13), el mapa de los caminos en la 
comarca, el diagrama de conexiones de aparatos eléctricos, las re- 
laciones de superioridad de algunos participantes de un torneo 
sobre otros, etc, 

A veces resulta cómodo dar otra definición de grafos. Puede 
considerarse que el conjunto de los arcos dirigidos U que unen los 
elementos del conjunto X refleja este conjunto en sí mismo. Por 
eso, puede considerarse presentado el grafo si están dados el con- 
junto de sus vértices X y el método de reflexión T del conjunto X 
en X. De esta suerte, el grafo G es el par (X, F), que consta del 
conjunto X y el reflejo T presentado en este conjunto: 


G=(X, T). (2-2) 


Así, para el grafo representado en la figura 2-1 el reflejo T se 

determina del modo siguiente: 
amla; To= Ø; Tc=(b,d, e); d= {d, c}; Te= 
Tg=h; h= ø. 

Es fácil ver que la definición de grafos dada coincide por com- 
pleto con la definición de relación en el conjunto. 

En ocasiones es conveniente representar los grafos en forma 
de ciertas matrices, en particular como matrices de adyacencia y 
de incidencia. Daremos previamente dos definiciones. 
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Dos vértices x e y se denominan adyacentes si son diferentes y 
existe un arco que va de x a y. 

El arco u se llama incidente con el vértice x si llega a este 
vértice o sale del mismo. 

Designemos por Xi, ..., Xn los vértices del grafo y por tn ... 
«+», Um Sus arcos. Introduzcamos los números: 


i, con el vértice j; 


1, si hay un arco que une el vértice 
Tu= 
0, si no hay tal arco. 


La matriz cuadrática R = || rą || del orden n X n se denomina 
matriz de adyacencia del grafo, 


ó 


Fig. 2-4. Vista general de un grafo 


Introduzcamos más adelante los números 


+1, si uy sale de x; 
sy=3 —1, si uy llega a xg 
0, si u; no es incidente con xi. 


La matriz S = [Isi || de orden n X m se llama matriz de inci- 
dencia de los arcos del grafo. 

Las matrices de incidencias sólo son aplicables en la forma 
descrita a los grafos sin lazos. En caso de haber lazos en el grafo 
hay que desmembrar dicha matriz en dos semimatrices: positiva 
y negativa. 

Introduzcamos algunos conceptos y definiciones que sirven 
para describir los distintos pos de grafos. 

Subgrajo Ga del grafo G = (X, F) se denomina el grafo que 
incluye sólo una parte de los vértices del grafo G que, junto con 
los arcos que unen dichos vértices, forman el conjunto A, como 
por ejemplo, la zona circunscrita con línea de trazos en la fi- 
gura 2-1. El subgraío Ga se define matemáticamente de la si- 
guiente manera: 


G= (A, Pp, (2-3) 
donde 
ASX, Tax= (NA. (2-4) 
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El grafo parcial G, con respecto al grafo G = (X, T) se llama 
al graío que sólo contiene una parte de los arcos del grafo G, es 
decir, definido por la condición 


Ga = (X, A), (2-5) 
donde 


Ax<=Tx. (2-8) 


Así pues, en la figura 2-1 el grafo formado por los arcos grue- 
sos es un grafo parcial. 
Ejemplo 2-1. Sea G = (X,T') el mapa de carreteras de la Unión Soviética, 


Entonces el mapa de carreteras de la región de Tambov constituye un subgrafo 
y el mapa de carreteras principales del la Unión Soviética, un grafo parcial. 


Son también importantes los conceptos de camino y contorno. 
Anteriormente se dio la definición de arco como el segmento diri- 
lo que une dos vértices. El arco que une los vértices a y b y está 
dirigido de a a b se designa por u = (a, b). 

Én el grafo G se denomina camino la secuencia de arcos p = 
= (u, ..., un) en la cual el final de cada arco anterior coincide 
con el comienzo del siguiente. El camino y cuyos vértices consecu- 
tivos son a, b, ..., m se designa por p == (a, b,..., m). Se llama 
largo del camino y = (ui, ..., Un) al número l(u)= k igual al 
número de arcos que constituyen el camino p. Este puede ser finito 
o infinito. En caso de ser infinito suponemos que l(u)= eo, El 
camino en el cual ningún arco se encuentra dos veces se denomina 
sencillo. Se llama elemental al camino en el cual ningún vértice 
se encuentra dos veces. 

El contorno es el camino finito u = (x1, ..., xa) en el que el 
vértice inicial x, coincide con el final xx. Por cierto, el contorno se 
denomina elemental si todos sus vértices son diferentes (a excep- 
ción del inicial y final que coinciden). Se llama lazo al contorno 
de largo unitario lórmádo por el arco de tipo (a, a). Así pues, en 
la figura 2-1 (e, d, c, b) es un camino, (c, e, d, c), un contorno y 
(d, d), un lazo. 

A veces se analiza el grafo sin tomar en consideración la orien- 
tación de sus arcos. En tal caso se denomina grafo no orientado. 
Para éste los conceptos de arco, camino y contorno se sustituyen 
por los de arista, circuito y ciclo. La arista es el segmento que une 
dos vértices. El grafo en la figura 2-1 tiene ocho arcos y siete 
aristas. Se denomina circuito a una secuencia de aristas. Se llama 
cielo al circuito finito en el que coinciden los vértices inicial y 

inal. 

Está vinculada al concepto de grafo no orientado una impor- 
tante característica denominada conexión del grafo. Se dice que 
el grafo es conexo si dos de sus vértices cualesquiera pueden co- 
nectarse en circuito. Si el grafo G no es conexo puede desmem- 
brarse en subgrafos G; tales que sean conexos todos los vértices 
en cada subgrafo y no lo sean los de los diferentes subgrafos, 
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Tales suberalos G; se denominan componentes de conexión del 
rafo 
$ Para determinar la conexión de un grafo orientado no es nece- 
sario atender a la orientación de los arcos. El grafo representado 
en la fígura 2-1 no es conexo, pero su subgrafo que consta de los 
vértices b, c, d, e es conexo. Para el grafo orientado existe el con- 
cepto de conexión fuerte. Un grafo es fuertemente conexo si para 
dos vérlices cualesquiera x e y (x Æ y) existe un camino que va 
e x a y. 
El árbol es un importante caso particular de grafo no orien- 
tado. Se denomina árbol el grafo conexo fínito no orientado des- 
provisto de ciclos. En la figura 2-2 se muestran ejemplos de árbo- 


es. 

Si está dado el conjunto de vértices a, b, c, ..., el árbol puede 
construirse del modo siguiente. Tomamos como vértice inicial uno 
de éstos, por ejemplo a, y lo denominamos raíz del árbol. Desde 


Fig. 2-2. Ejemplos de árboles 


este vértice trazamos aristas a los vértices contiguos b, c, d, ..., 
desde éstos trazamos las aristas a los vértices vecinos de los mis- 
mos e, f, g, h,..., etc. De esta manera, el árbol puede construirse 
añadiendo consecutivamente aristas en sus vértices. Esto ofrece la 
posibilidad de establecer el vínculo entre el número de vértices y 
el de aristas del árbol. 

El árbol más sencillo consta de dos vértices unidos por una 
arista. Cada vez que añadimos una arista más en su extremo se 
adiciona también un vértice. Por lo tanto, un árbol con n vértices 
tiene n — l aristas. 


b) Relación de orden y relación de equivalencia 
en un grafo 


Como hemos visto, el grafo proporciona una cómoda represen- 
tación geométrica de las relaciones en un conjunto. Por eso la teo- 
ria de los grafos y la teoría de las relaciones en el conjunto se 
complementan mutuamente, 

Vamos a considerar que en el grafo G = (X, T) se ha introdu- 
cido una relación de orden si para dos vértices cualesquiera x e y 


3 ax a 65 


que satisfagan la condición x< y existe uñ camino de x a y. En 
este caso se dice que el vértice x precede al y y que éste sigue al x. 
Mostremos que la definición dada refleja en el grafo todas las 
propiedades de la relación de orden. 
eflexividad. La condición 


x<x es cierto (2-7) 


y denota la equivalencia del vértice a sí mismo, es decir, la condi- 
ción x = x. No obstante, si se quiere, dicha condición puede con- 
siderarse como la existencia de un camino de x a x, o sea, como 
un lazo en el vértice x (fig. 2-3, a). 

Transitividad. La condición 


xy, y<z>x<z (2-8) 


denota que los vértices x, y, z se encuentran consecutivamente en 
un mismo camino (fig. 2-3, b) 


Y 
O 
a) F 
2 2, 
9] 0) 


Fig. 23, Ilustración de las propiedades de una relación de orden 


Asimetria. Demostremos que es cierta la condición 
xy, y<x>oxe=y. (2-9) 


El primer miembro de esta expresión indica que existe un ca- 
mino de x a y, así como también, un camino de y a x. Pero esto 
significa que en el graío hay un contorno en el cual están los vér- 
tices x e y (fig. 2-3, c). 

Del segundo miembro de la condición (2-9) se desprende que 
los vértices que están en un mismo contorno son equivalentes. Va- 
mos a considerar esta deducción como la definición de equivalen- 
cia en el grafo y demostremos que tal definición satisface las tres 
condiciones de la relación de equivalencia. Las condiciones de 
reflexividad x = x y simetría x == y >y == x son evidentes y se 
derivan de la definición de equivalencia dada anteriormente. Tam- 
bién es evidente la condición de transitividad x = y, y = 2z > 
—>x = Z ya que indica que si en el graio hay un contorno con los 
vértices x e y, así como con los vértices y y z, entonces existe 
asimismo un contorno en el que se encuentran los vértices x y z, 
(véase la fig. 2-3, c). 

De esta suerte, la relación de orden al igual que la relación de 
equivalencia definen cierto grafo. 
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En el grafo también puede introducirse la relación de orden 
estricto. En este caso, para dos vértices cualesquiera x e y que 
satisfagan la.condición x < y, hay un camino que va de x a y. La 
condición de transitividad x < y, y <2>x< 2 significa, como en 
el caso anterior, que los vértices .*, y,:2 se encuentran consecutiva- 
mente en un mismo camino. La condición de antirreflexividad 
EN x es falso) indica la ausencia de lazos en el grafo y la con- 

ición de asimetria (x < y, y <x se excluyen mutuamente), la 
falta de contornos. 

De este modo, la relación de orden estricto define un grafo sin 
contornos. 


c) Características de los grafos 


La resolución de muchos problemas técnicos por los mélodos de 
la teoría de los grafos se reduce a la determinación de unas u 
otras características de éstos. Aunque en la presente obra es im- 
posible examinar las aplicaciones técnicas de la teoría de los gra- 
fos, el conocimiento de las características más relevantes de los 
grafos, puede resultar de provecho al estudiar otras disciplinas. 

Número ciclomático. Sea G un grafo no orientado que tiene n 
vértices, m aristas y r componentes de conexión. Se denomina nú- 
mero ciclomático de un grafo G el número 


v(6)=m=—n-+r. 


Este número tiene un interesante sentido físico: es igual al nú- 
mero máximo de ciclos independientes en el grafo. El número 
ciclomático puede utilizarse al calcular los circuitos eléctricos 
para determinar el número de contornos independientes. 

Número cromático. Sea p un número natural, El grafo G se 
denomina p-cromático si pueden colocarse sus vértices con p colo- 
res distintos de tal modo que no se coloreen igualmente dos vérti- 
ces adyacentes cualesquiera. El número menor p con el cual el 
grafo es p-cromático se denomina número cromático del grafo y 
se designa por y(G). 

i y(G)=2, el grafo se denomina dicromático. La condición 
necesaria y suficiente para que el grafo sea dicromático es que 
no tenga ciclos de largo impar. El número cromático juega un 
papel importante al resolver el problema de utilizar con máxima 
economía las células de la memoria durante la programación. Pero 
salvo en el caso del grafo dicromático su determinación constituye 
una tarea bastante dificil que con frecuencia requiere el empleo de 
calculadoras electrónicas. 

Conjunto interiormente estable, El conjunto S = X del grafo 
G = (X, T) se denomina interiormente estable si no son adyacen- 
tes dos vértices cualesquiera de S, es decir, si para cualquier 
xÆ S se cumple que Tx Ñ S = Ø. 
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El conjunto interiormente estable que contiene el número 
mayor de elementos se denomina conjunto interiormente estable 
máximo, y el número de elementos de este conjunto se Hama nú- 
mero de estabilidad interna del grafo G. El conjunto interiormente 
estable máximo juega gran papelen la teoría de la comunica- 
ción. 

Conjunto exteriormente estable, El conjunto T œ X del grafo 
G = (X, T) se denomina exteriormente estable si cualquier vértice 
no pertaneciente a T está conectado por arcos con los vértices que 
parten de T, es decir, si para cualquier x g£ T se cumple Tx f T = 
+ 


El conjunto exteriormente estable que contiene el número me- 
nor de elementos se llama conjunto exteriormente estable mínimo, 
y el número de elementos de este conjunto se denomina número 
de estabilidad externa del grafoG. 


2-2. PROBLEMA DEL CAMINO MINIMO 


a) Enunciado del problema 


Para aplicaciones prácticas tiene gran importancia el problema 
de encontrar el camino mínimo entre dos vértices de un grafo 
conexo no orientado. Se reducen a éste muchos problemas de elec- 
ción de la ruta más económica (desde el punto de vista de la dis- 
tancia, el tiempo o el costo) en el mapa de carreteras existente 
y muchos problemas de elección del modo más económico para 
convertir un sistema dinámico de un estado en otro, etc. En mate- 
málicas se han elaborado diversos métodos para resolver semejan- 
tes problemas. Sin embargo, con gran frecuencia los métodos ba- 
sados en el uso de los grafos son los menos engorrosos. 

El problema del camino mínimo en un grafo puede enunciarse 
en general del modo siguiénte. Está dado el grafo no orientado 
G =(X, U). Se ha asignado a cada arista de este grafo cierto nú- 
mero (u) > 0 denominado largo de la arista. En casos particula- 
res [(u) puede ser la distancia entre los vértices unidos por la 
arista u, el tiempo o costo del viaje por esta arista, etc. Entonces, 
cualquier circuito u va a caracterizarse por el largo 


L= E 160. (2-10) 


Para dos vértices cualesquiera a y b del grafo G es necesario 
hallar precisamente aquel camino pas cuyo largo total sea mínimo. 
Antes de hallar el método general de resolución de este pro- 
blema examinemos la regla para solucionar los problemas del 
tipo particular en que el largo de cadaarista es igual a la uni- 
ad. 
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b) Búsqueda del camino mínimo: en un grafo con aristas 
de largo unitario 


A veces resulta necesario operar con grafos cuyas aristas 
tienen un largo igual que se toma como unidad. Los vértices de tal 
grafo representan habitualmente los :estados de algún sistema en 
el que desde cierto punto de vista son equivalentes todos los trán- 
sitos realizados con un paso. Pongamos un ejemplo de problema 
que se reduce al examen de un EUA con aristas de largo unitario. 
Él problema dado puede servir de ilustración de los métodos de 
construcción de grafos para los diferentes casos concretos, 

Ejemplo 2-2. Problema de la torre de Hanói. Un tablero tiene tres estacas. 
En la primera están ensartados m discos cuyo diámetro disminuye de abajo 
arriba. Se plantea el problema siguiente: haciendo pasar los discos uno por uno, 


0 1 22k 
6) 


Fig. 2-4. Grafo de las transiciones en el problema de la torre de Hanoi 


colocarlos en el mismo orden en la tercera estaca utilizando la segunda en cali- 
dad de intermendíaria y cumpliendo la condición de que durante ningún paso 
el disco mayor quede encima del menor en ninguna de las estacas. Como con 
dición adicional puede exigirse hallar la solución que requiere el menor número 
de pasos 

PNumeremos los discos en orden decreciente de diámetros: m, m—1, „+, 1 
Designemos por X, Y, Z los conjuntos de discos ensartados, respectivamente, en 
la primera, Segunda y tercera estacas en cualquiera de los pasos Al hacerlo 
es "suficiente indicar solamente los conjuntos X y Z, ya que el conjunto Y se 
obtiene como complemento de los conjuntos X y Z hasta el número total de dis- 
cos. Cada uno de los conjuntos X o Z puede ser una de las combinaciones de 
discos siguientes O, 1. 2, 21. 3, 31. 32, 32), 4, 41, 42, 421, 43, 431, 432, 4321 
Estas combinaciones pueden representarse con puntos convencionales en los ejes 
X y Z, como se muestra en la figura 2-4, de suerte que cualquier disposición 
de los discos se representará con cierto punto en el plano (X, Z). Uniendo di- 
chos puntos por medio de líneas que señalen los desplazamientos posibles de 
discos en cada paso, obtenemos un grafo no orientado en el que puede ha- 
llarse el camino, e incluso el mínimo, para transitar del punto inicial al final 
del grafo. 
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Puede realizarse la construcción del grafo pasando de m a m-+1 discos. 
Con m = I, los estados posibles van a representarse por el conjunto (ao, 
(0,0), (0,13), al cual corresponde el grafo de la figura 2-4,a con el tránsito 
mínimo del estado inicial (1,0) al final (0,1) indicado en ella. 

Para obtener una regla generał supongamos que ya está construido un gra- 
fo para el caso de m discos que llamaremos grafo m. Es fácil cerciorarse de 
que este grafo tendrá la forma del triángulo representado en la figura 2-5, a, 
aunque sus conexiones internas nos son desconocidas por el momento. ¿Cual 
será entonces el grafo para m + 1 discos? 

Notemos que el disco con el número m-+1 sólo puede ocupar la posición 
inferior en cualquiera de tas estacas. Los m discos restantes pueden desplazarse 
de cualquier manera coniorme al grafo m sin cambiar la posición del disco 


ADAL) 
6) 
Fig. 2-5. Transición del grafo m al grafo (m+1) 


m + 1, Por tanto, el grafo para m +1 discos (fig. 2:5,0) constará de tros gra: 
fos m designados por cifras (encerradas en círculos) /, 2 y 3 que significan 
el número de la estaca en la que se halla el disco m'+ 1. Sólo quedan por 
aclarar las transiciones de un grafo m a otro que corresponden al desplaza. 
miento del disco m -+ 1. 

Unicamente puede pasarse el disco m-+1 a una estaca libre y esto sólo 
es posible en caso de que en una de ellas estén colocados todos los discos me- 
nores m. Según esto, en la figura 2-5, b, se muestran las transiciones posibles 
del disco m +- 1 designadas por las cifras /, 2 y 3 que denotan el número de la 
estaca en la que se hallan los m discos menores. 

El diagrama mostrado en la 47 2-5,b da el principio general de transi- 
ción del graio m al grafo m-+-1. En la figura 2-4,b y c se brindan los gra. 
fos de las transiciones para dos y tres discos. 


Pasemos al problema de hallar en el grafo el camino mínimo 
que une el vértice inicial con el final. Por cuanto los grafos consi- 
derados son relativamente sencillos, no es difícil hallar el camino 
mínimo simplemente seleccionando los caminos posibles. No obs- 
tante, debe hallarse un método sistemático para los grafos compli- 
cados. 
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La regla general para hallar el camino mínimo en un grafo 
consiste en atribuir a cada vértice x; un indice %s, igual al largo 
del camino mínimo desde el vértice dado hasta el vértice final. La 
asignación de los indices a los vértices en el caso del grafo con 
aristas de largo unitario se realiza en. el orden siguiente: 

1) se atribuye el índice O al vértice final xo; 

2) se asigna el índice 1 a todos los vérlices desde los cuales 
va la arista hasta el vértice final; 

3) se atribuye el indice 2. + 1 a todos los vértices que aún no 
tienen índices y desde los cuales la arista va hasta el vértice con 
el índice A; Se continúa este proceso hasta que no se marque el 
vértice inicial. Al terminar de marcar, el índice del vértice inicial 
será igual al largo del camino mínimo. Hallaremos el mismo ca- 
mino mínimo si vamos a movernos desde el vértice inicial en la 
dirección en que disminuyen los índices. 

En la figura 2-4, c se muestra un ejemplo de marcado y deter- 
minación del camino mínimo para m = 3. 

Señalemos que el método descrito para determinar el camino 
mínimo es un caso particular de búsqueda de la solución óptima 
por el método de programación dinámica. Por eso, después de 
estudiar la programación dinámica será conveniente volver a exa- 
minar dicho ejemplo. 


c) Búsqueda del camino mínimo en un grafo 
con aristas de largo arbitrario 


La tarea de atribuir índices numéricos a los vértices del grafo 
se dificulta si las aristas del grafo tienen un largo arbitrario. La 
dificultad se debe a que en un grafo complejo el camino que pasa 
por el número menor de vértices, tiene con frecuencia mayor largo 
que algunos caminos de rodeo. Así pues, en el grafo de la e 
gura 2-6 que representa un mapa de carreteras el camino directo 
del vértice marcado con un asterisco'al vértice final tiene el largo 
1 = 12, mientras que el camino indirecto a través del vértice mar- 
cado con un triángulo tiene el largo | =-10. 

El proceso de asignación de índices a los grafos de este tipo 
consiste en lo siguiente: 

1. Cada vértice x; se marca con el índice 4. Inicialmente se 
atribuye el índice Ao O al vértice final xo. Para los demás vérti- 
ces suponemos previamente que A, = œ (i + 0). 

2. Buscamos un arco (X: x;) tal que para él y — i; > 
> lxs xj) y sustituimos el índice A; por el indice % = M + 
+ [(Xi xj) < hy. Continuamos este proceso de sustitución de los 
índices mientras quede un arco siquiera para el cual se pueda dis- 
minuir Ay. 

'Apuntemos una propiedad importante que van a poseer los in- 
dices atribuidos a los vértices. Sea xp un vértice arbitrasio. Du- 
rante el proceso de asignación de índices considerado, el índice Ap 
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disminuye monótonamente. Sea x el último vértice que sirve para 
su disminución. Entonces Ap = À +1 (Xg, Xp). Por tanto, para el 
vértice arbitrario xp con índice àp se encuentra el vértice xg unido 
A Xp mediante una arista tal que Àp — q = l (Xq, Xp). 

Esta propiedad permite formular la siguiente regla para hatlar 
el camino mínimo. 

Sea x,=4a el vértice inicial con el índice y,. Hallemos el 
vértice xp, tal que An — Ap, = l (Xp, Xa). Hallemos después el vér- 
tice xp, tal que Ap — (Xp Xp), etc., hasta que nó llegue- 
mos al vértice final x,,, =x9=0. El camino fy=(Xa, Xp» «s Xpy X0) 
de largo A, es el camino más corto. 


Fig. 2-6. Mapa de carreteras 


Para la demostración examinaremos un camino arbitrario de 
a a b: p= (Xm Xip soas Xr,» Xo). Su largo será I(p). Conforme a 
la regla de ordenación de los índices se cumplirán las siguientes 
desigualdades: 
An — An, Ln, Xa); 


Ae — Ae, < L (Xen Xa); (211) 


ar, —0< L (2r, X). 


Sumando miembro a miembro estas desigualdades encontramos 
que para cualquier camino p se cumple 


An — 0< 1 (u). (2-12) 
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Como que para el camino po se :satisiace la condición An == 
= (Up) éste es mínimo. 1 

El método de búsqueda del camino más corto está ilustrado 
mediante el ejemplo del mapa de carreteras representado en forma 
de grafo en la Fgura 2-6. Las cifras en las aristas señalan. el 
tiempo de viaje por cada una de las carreteras. Los índices de los 
vértices muestran el tiempo de viaje desde el vértice dado hasta el 
vértice final. 


d) Construcción del grafo de largo mínimo 


Tiene gran importancia práctica el siguiente problema que puede 
enunciarse como el problema dei trazado de carreteras. Hay varias 
ciudades a, b, c ..., que es necesario comunicar entre sí mediante 
una red de carreteras. Para cada par de ciudades (x, y) se conoce 
el costo de construcción t(x, y) de la carretera que las une. 

El problema consiste en construir la más barata de las redes 
de carreteras posibles. En lugar de la red de carreteras puede con- 
siderarse la de líneas de transporte de energía eléctrica, la de 
oleoductos, etc. Denominando largo de la arista (x, y) a la magni- 
tud L(x, y) en el grafo que representa la red de carreteras, llega- 
mus al problema de la construcción del grafo de largo mínimo. 
Por eso, en lo adelanté vamos a considerar el largo de las aristas 
del grafo en vez del costo de las carreteras. 

Si existen sólo tres vértices a, b, c es suficiente construir uno 
de los circuitos de unión abc, acb y bac, por cierto, si bc es la 
arista más larga entonces hay que excluir precisamente la misma 
construyendo el circuito bac. P 

El grafo de largo mínimo es siempre un árbol ya que si contu- 
viera un ciclo podría eliminarse una de las aristas de éste y los 
vértices quedarían unidos todavía. Por consiguiente, para unir n 
vértices hay que construir n — I aristas, 

Mostremos que puede construirse el grafo de largo minimo 
empleando la regla siguiente, Ante todo unimos dos vértices con la 
arista de unión más corta xı. En cada uno de los pasos siguientes 
añadimos la arista más corta de las aristas u; que no forma nin- 
gún ciclo al unirse a las aristas ya existentes. Si hay varias aristas 

le igual largo elegimos cualquiera de ellas. Vamos a denominar 
árbol económico a cada árbol Q construido de esta manera. Su 
largo es igual a la suma de las aristas por separado: 

LQ =l) o + liaa). (2-13) 

Mostremos que ningún otro árbol que une los mismos vértices 
puede tener un largo menor que el del árbol económico Q. Sea P 
el árbo! de largo minimo que une los vértices considerados y Q 
cualquier árbol económico, Supongamos que las aristas 41, a, ... 
¿+++ Uy están numeradas en el mismo orden en el cual se unieron 
para construir Q, es decir, satisfacen la condición ¿(4a) < (Une). 
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Si el árbol P no coincide con el Q, este último tiene por lo menos 
una arista que no pertenece a P. Sea u; = (a, b) la primera de 
estas aristas y L(a, b) el circuito del grafo P. que une los vérti- 
ces a y b, como lo muestra por ejemplo ta figura 2-7. Si añadimos 
a P la arista u; obtenemos un ciclo, y como Q no tiene ciclos, debe 
formar parte de éste por lo menos una arista no perteneciente a Q. 
Sea ésta u¡. Eliminándola, obtenemos el árbol P’ con el mismo 
número de vértices que P, cuyo largo es: 


UP) = 1 (P) +1 (ui) — 1 (ui). (2-14) 
Como que el grafo P tiene el largo mínimo 
L (u) >1 (uh). (2-15) 


Pero u; era la arista de largo mínimo con la que no se obtienen 
ciclos al añadirla a las aristas 41, ua, ..., i—i. Como que al adi- 


Fig. 2-7. Para la construcción del árbol de largo mínimo 


cionar u; a dichas aristas, tampoco se origina algún ciclo, en- 
tonces 

4 (u) = l (ui) (2-16) 
y, por lo tanto, P” tiene largo minimo al igual que P. Sin embargo, 
P’ tiene una arista común más que P con el árbol económico Q. 
Repitiendo varias veces esta operación obtendremos el árbol de 


largo mínimo que coincide con Q. Por consiguiente, Q es el árbol 
de largo minimo. 


2-3. REDES DE TRANSPORTE 


a) Conceptos fundamentales 


Se denomina red de transporte el grafo finito sin lazos en el 
cual: 

1) existe un y sólo un vértice xo tal que T-!xo = Ø (este vér- 
tice se llama entrada de la red); 

2) existe un y sólo un vértice z tal que Pz = Ø (este vértice 
se denomina salida de la red); 

3) a cada arco del grafo u se refiere un número entero c(u) 
llamado capacidad de paso del arco u. 


74 


El concepto de flujo está muy vinculado al de la red de trans- 
porte. Sea x un vértice arbitrario. Designemos por U7 el conjunto 
de los arcos que entran en x, y por UZ et conjunto de los que 


Fig. 28. Distribución de flujos en la 
red de transporte 


salen de x. Se denomina flujo por la red de transporte la función 
p(u) que satisface las condiciones 


0<q()<c (4), 4SU; (2-17) 
E wW Y pu=0; 1x, xz (218) 
wavy sau? 


La función qp(u) puede considerarse como la cantidad de ma- 
teria que pasa (en la unidad de tiempo) por el arco u = (x, y) de 
x a y. Según la condición (2-17) esta cantidad no puede exceder 
de la capacidad de paso del arco c(u). De acuerdo con la condi- 
ción (2-18) en cada vértice x distinto de la entrada xo y de la 
salida z, la cantidad de materia que llega es igual a la que sale. 
Por lo tanto, ésta no puede acumularse en ningún vértice de la 
red de transporte excepto la entrada y salida. Esto significa que 
el flujo saliente del vértice de entrada xo es exactamente igual al 
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entrante en el vértice de salida z: 
Z tws L_e(0=0. (2-19) 


“sul, saoz 


La magnitud p(=) se denomina magnitud del flujo de la red de 
transporte. 

En la figura 2-8 se ofrece un ejemplo de la red de transporte. 
Las cifras en las discontinuidades de los arcos señalan la capaci- 
dad de paso del arco. Las fleċhas indican la dirección de los flujos 
y las cifras junto a las flechas, la magnitud dei mismo. Muchos 
problemas que surgen durante la planificación de suministros, 
distribución de mercancías entre consumidores, etc., se reducen al 
análisis de redes de transporte. 

Para investigar la distribución del flujo en la red de transporte 
conviene introducir el concepto de corte de dicha red. Sea A c X 
cierto conjunto que satisface las condiciones 


EA 2zSA (2-20) 


Designemos, respectivamente, por UA y UF los conjuntos de 
arcos que entran en A y salen de A. Llamaremos corte A de la red 
de transporle al total de los arcos Ua =U7 UUÍ. En la figura 2-8 
se muestra un ejemplo de corte. 

Por cuanto cada partícula de materia que se mueve de xp a 2 
pasa obligatoriamente por algún arco del corie, el flujo total a tra- 
vés de éste será igual a la magnitud del flujo de la red de trans- 
porte, es decir, para cualquier corte A, se cumple la -relación 


t= E gpw E ow (2-21) 


- + 
uev} ueuj 


Denominaremos capacidad de paso dei corte A a la suma de 
las capacidades de paso de los arcos que entran en este corte: 


c(4)= E cli). (9-29) 
uav 
Ya que en cualquier arco ocurre que (u) < c(u), de (2-21) y 
(2-22) se deduce que 
9.<c(4). (2-23) 


b) Problema del flujo máximo 


El problema del flujo máximo en una red de transporte se enun- 
cia del modo siguiente. Estando dada la configuración de la red 
de transporte y siendo conocida la capacidad de paso de los arcos, 
hallar la magnitud máxima del flujo que puede dejar pasar dicha 
red así como la distribución de este ilujo en los arcos de la red. 
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Lema. Si para cierta magnitud del.Hujo de la red de transporte 
q. y cierto corte V se cumple que q. = c(V), el flujo q. es el 
mayor y el corte V tiene la menor capácidud de paso. 

Demostración. Como se mostró, la magnitud del flujo q. para 
cualquier corte A debe satisfacer la relación (2-23). Designemos 
por Y el corte con la capacidad de paso mínima: 


c(V)= min c(A). (2-24) 


Como la magnitud del flujo q. es la misma para cualquier corte 
de la red de transporte, el aumento de la magnitud de dicho flujo 
sólo es posible hasta que éste alcance el valor c(V). Por consi- 
guiente, la magnitud del flujo 


9.=c(V) (2-25) 


determina el flujo máximo de ła red de transporte. 

Sin embargo, el lema dado no ofrece todavia un método para 
determinar en la práctica et flujo máximo. Para formular tal mé- 
todo, introduzcamos algunas definiciones auxiliares. 

Llamaremos saturado al arco u, cuando q (u)= c (4). Denomi- 
naremos completo el flujo œ, si cada camino de xy a z contiene 
por lo menos un arco saturado. 

Para una red de transporte dada, el flujo completo no es una 
magnitud rigurosamente Senmi aa y depende de la dirección 
de los flujos en los diferentes arcos. Āsi pues, en la figura 2-8, 
a y € se brindan dos distribuciones distintas del flujo por la misma 
red de transporte. Los arcos saturados están trazados con lineas 
gruesas. En ambos casos los flujos son completos aunque sus 
magnitudes son diferentes. 

El algoritmo para hallar el flujo máximo, propuesto por Ford 
y Faikerson, consiste en el aumento paulatino del flujo q. hasta 
que éste llegue a ser máximo. En dicho caso se supone que las 
capacidades de paso de los arcos c(u) son números enteros, de 
modo que los flujos en los arcos van a expresarse también con 
números enteros. La búsqueda del flujo completo se realiza en dos 
etapas. 

1. Búsqueda del flujo completo. Sea q(u) cierta distribución 
del flujo en los arcos de la red de transporte. Busquemos el cami- 
no p de xo a z todos los arcos del cual no están saturados y supon- 
gamos que 
u) +1 para uE p; 


g (w) para u $p. 12-26) 


g (u) =( 

Entonces el flujo q. cambia hasta la magnitud g) =p, + 1>Q,. 

De este modo efectuamos el aumento paulatino de q, hasta que 
éste no se vuelva completo, 
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Ejemplo 2-3. Hallemos el flujo completo en la red de transporte (véase 
la fig. 2-8, a). Examínemos consecutivamente los caminos siguientes, marcando 
con lineas gruesas los arcos saturados: 


Bi = (Xo, Xs, Xa, 2), p(1u) = 1, se satura el arco (xo, x1); 
Ha = (Xo, Xa, Xi, X3, 2). Q(Ms) = 1, se saturan los arcos (xax) y (xs z); 
Ha = (xo, x2, x4, 2); para saturar este camino puede tomarse (u) = 2 y 
se satura el arco (x2, x:). 


Es fácil ver que no hay más caminos de xo a z que contengan arcos no sa- 
turados. Por lo tanto, el flujo completo es 


9 = F (41) + p (pa) + q (13) =4. 


2. Búsqueda del flujo máximo. Sea q. el flujo completo y 
p(x, y), el flujo en el arco u = (x, y), dirigido del vértice x al vér- 
tice y. El proceso de incremento de q. consiste en marcar los vérti- 
ces del grafo con índices que señalen el camino en el cual es po- 
sible aumentar el flujo. Todos los vértices del graío deben ser 
numerados previamente. 

Marcamos xo con el índice 0. Si x; es un vértice ya numerado, 
marcamos con el índice + í todos los vértices no marcados, en los 
cuales van saliendo de x, los arcos no saturados, o sea, los vértices 
y para los que 


(9 SU y pln y) < eln y), (2-27) 

1 con el indice —i todos los vértices no marcados de los cuales 
los arcos van al vértice x,, es decir, los vértices y para los cuales 
(yx EU y ply, x) >0. (2-28) 


Si en este proceso resulta marcado el vértice 2, entre los vér- 
tices xo y z habrá un circuito! todos los vértices del cual son dis- 
tintos y (con una exactitud de un signo) están marcados con los 
números de los vértices precedentes. Áumentamos el flujo de todas 
las aristas de este circuito en una unidad en el sentido de xo a 2, 
es decir, suponemos que ñ 


g (u) = q (u), siu É p; 
v a=gpu+l, siusn 


al moverse de xo a 2, el arco u pasa en la dirección de su orien- 
ación; 


g (u= g (u) — 1, siu& p 


y al moverse de xo a z el arco u pasa en la dirección opuesta a su 
orientación. 

Como resultado de este proceso se obtiene un nuevo [lujo por 
la red y =Q, + 1, o sea, crece la magnitud del flujo. Después se 
repite el proceso. 

Si es imposible aumentar cierto flujo q? por el método descrito, 
es decir, si resulta imposible marcar el vértice z, entonces q? con- - 
stituye el flujo máximo de la red. En efecto, sea V el conjunto de 
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los vértices no marcados que incluyen también el vértice z. Por lo 
tanto, V es un corte y precisamente aquel que no tiene arcos de 
salida (en caso contrario algunos vértices de este corte estarian 
marcados con índices -negativos), y todos los arcos de entrada, 
saturados: 


Uy =Uv; U=; 
y=Uy, U =ð; a dd) 
gu =c (u) para us Uy. 
Siendo 
g= Z oW- È em= Y c(u)—0=c(V). (2-30) 


usuz uav$ savy 


Según el lema demostrado anteriormente ¢% es el flujo mayor, 
y V el corte con Ja menor capacidad de tráfico. 

Ejemplo 2-4. En la figura 2-8, a se muestra cómo se han marcado los in- 
dices de los vértices de la red de transporte. El vértice x resultó marcado con 
el índice +4. La secuencia de los índices +4, —3, -+2, +0, determina el circuito 
M = (Xo, X2, X3, Xy, 2), cuyo flujo de xo a z hay que aumentar en una unidad, 
Esto conduce a la distribución del flujo mostrada en la figura 2-8, 6. Repitiendo 
el proceso de marcado de los índices en este dibujo, hallamos el circuito p = 
<= (xo, 2, Xt, Xs, Xu 2) cuyo flujo también debe aumentarse en una unidad. La 
distribución, resultante del flujo se muestra en la figura 2-8,c, Al marcar los 
Índices en este dibujo quedan sin marcar los. vértices xi y z. 

Por tanto, la distribución del flujo obtenida garantiza el flujo máximo 92 
en la red de transporte considerada, y el conjunto Y = (xi, 2) determina el cor- 
te con la capacidad de tráfico mínima, La magnitud del flujo 9% se halla de- 
terminando la capacidad de tráfico del corte V: 


g= c (Ey t4) + E (X3 14) 0 ($y 2) 23414220, 


Se puede aumentar el flujo máximo de la red de transporte anmentando la 
capacidad de tráfico de cualquiera de los arcos incluidos en el co“te V. 


e) Problema de transporte 


A la par con el problema de la búsqueda del flujo máximo, 
tiene gran importancia práctica el problema de la distribución má: 
económica del flujo en los arcos de la red de transporte que recibió 
la denominación de problema de trasporte. Por cuanto en muchos 
casos la red de transporte constituye el esquema de organización 
de traslados de algunas cargas, la resolución del problema de 
transporte permite determinar el plan de traslados más racional, 
es decir, la distribución de las rutas que garantice, por ejemplo, 
el costo mínimo de los traslados o de la entrega de las cargas al 
consumidor en un- tiempo mínimo. El primer problema recibió el 
nombre de problema de transporte según el criterio del costo y el 
segundo, de problema de transporte según el criterio del tiempo. 

Para facilitar la exposición ulterior, designemos: Ci¿=C(X4 Xy), 
la capacidad de tráfico del arco (xs, x;) y dis =d (Xi X5), el costo 
de paso de la unidad de flujo por el arco lea xj). 
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El problema de transporte según el criterio del costo se puede 
enunciar en términos de la teoría de los grafos del modo siguiente. 

Están dados la red de transporte con el flujo máximo q? y el 
flujo p, <q2 que debe pasar por esta red de transporte. Se re- 
quiere hallar la distribución del flujo q, por los arcos de la red 
de transporte que asegure el costo mínimo del paso del flujo. Con 
esto, para cada arco debe cumplirse la relación q (Xi, x3) < cij, y el 
onlo del pag del flujo p(x;, x;) por el arco (x: xj) debe ser igual 
a dip(X xy). 

Para resolver este problema vamos a considerar las magnitu- 
des dij como largos de los arcos respectivos. En este caso el costo 
del paso del flujo p por cierto camino p desde xo hasla z será 
igual al producto del largo de dicho camino por la magnitud del 
flujo q y el problema de la minimización del costo del paso del 
flujo se reduce a la solución del problema anteriormente estudiado 
de la búsqueda del camino minimo en el grafo de xp a z. En el 
caso en que no haya limitaciones en cuanto a la capacidad de 
tráfico de los arcos, el camino minimo es el que garantiza el costo 
mínimo del paso del flujo. 

Al existir limitaciones de capacidad de tráfico de los arcos el 
problema se resuelve en varias etapas hallando los flujos par- 
ciales en cada etapa. El método general de resolución del problema 
consiste en lo siguiente. 

En el grafo Gi =(X,T) que representa la red de transporte 
con largos de arcos di; == [(x;, x) se halla el camino minimo m 
de xo a z. Sea c, la capacidad de tráfico del camino ju. Por este 
camino se conduce el flujo 


{ Po SiP Sc; 
a= 


Cn sip,> cr 1231) 


Si q. < ci, el problema está resuelto y pı es el camino más 

económico para el flujo q». 
Si (p. > cı, entonces consideramos a p; como flujo parcial y pa- 

samos al grafo Gz que se obtiene del gráfo G, sustituyendo las 


capacidades de tráfico de los arcos c por cí; de la relación 
> Cij—C) para Spy; 
cy= 
Cy para u Ép 


Por cierto, se excluyen del análisis los arcos en los cuales 
cĉ =0. El flujo cuya distribución se busca en el grafo Gz se 
toma igual a 


(2-32) 


=P, — O (2-33) 


Ahora surge el problema inicial de buscar la distribución más 
económica del flujo pí pero ya con respecto al grafo Gs. Su. reso- 


lución da el camino pz con la capacidad de tráfico cz a través del 
$0 


cual se hace pasar el flujo parcial 


Y sig Kc; 
omla > en 
Si <c, el problema está resuelto y la distribución de flujos 
más económica en el grafo G, será el paso del flujo pı por el ca- 
mino yu y del flujo qa por el camino yz. 

Sig? > c,hay que recurrir a un nuevo grafo Gs y hallar un 
nuevo flujo parcial «ps. Este proceso se repite hasta que la suma 
de los flujos parciales alcance el valor q. Estos flujos parciales 
conducidos por el grafo G, proporcionan, en efecto, la distribución 
más económica del flujo qu. 

Para ilustrar el método descrito, examinaremos la variante más 
difundida del problema de transporte según el criterio del costo. 


En las estaciones Xi ..., Xm 
hay una carga semejante en can- Tabla 2-1 
tidades ar, . - . , Am. Se requiere con- Problema de transporie 
ducirla en cantidades bi, ..., bra —— 
las estaciones yı, ..., Yr Se supo- b; 
ne que la cantidad total de carga di AAA AS 
requerida es igual a las reservas b, | kss bp 
existentes: 
A de AA? 
astor (2-35) TRARA 


El costo del traslado de la car- dmi TRE 
ga de la estación xi a la yes °” A | en. 


igual a di; Se necesita hallar las 
rutas más económicas para transportar las cargas. Es cómodo 
anotar los datos iniciales en forma de la tabla 2-1. 

La red de transporté correspondiente a este problema se cons- 
truye del modo siguiente. La entrada xy se une a cada uno de los 
vértices. x; mediante un arco con capacidad de tráfico c(Xo, Xi) =4j. 
Cada uno de los vértices y; se une a la salida z por medio de un 
arco con capacidad de tráfico c(y;,2)= b;. El costo de paso del 
flujo por los arcos (Xo, xs) e (yy 2) se considera igual a cero. Fi- 
nalmente, cada vértice x; se une con cada vértice y, mediante un 
arco de capacidad de tráfico infinita. El costo de paso por éste de 
la unidad de flujo es igual a dı. Más adelante se aplica a esta 
red de transporte el método ya estudiado. 

Ejemplo 2-5. Hallar las rutas más económicas para el problema de trans- 
porte planteado en la tabla 2-2. Esta tabla corresponde al esquema de los ca- 
minos que comunican las fábricas productoras de piezas de construcción con 
los consumidores de dichas piezas (obras), mostrado en la figura 2-9. En la 
figura, 210 se ofrece la red de transporte correspondiente a los datos de la 
abla 2-2. 
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Utilizando el método descrito más arriba hallamos los ¡lujos parciales y 
las rutas enumerados en la tabla 2-3 en el orden de su obtención. El plan de 
transporte correspondiente a esta tabla se muestra asimismo en el esquema de 
caminos, 


No es difícil ver que en el caso general el costo de traslado de 
las cargas por la red de transporte del tipo considerado se deter- 
mina mediante la expresión 
Tabla 2-2 


Datos iniciales del probl $s 
mos Ude transporte CT È E un y): (2-30) 


Por consiguiente, el método ana- 
lizado para resolver el problema 
de transporte, brinda en esencia la 
forma de hallar las magnitudes de 
los flujos parciales q a que 
minimizan la suma indicada. El 
método de resolución examinado 
no es único. Encontraremos proble- 
mas similares en la sección dedi- 
«ada a la programación lineal 
donde se mostrarán otros métodos para resolver problemas aná- 
logos. 

e naismo la rárolicción dal problema de transporte por el cri- 
terio del liempo mediante el ejemplo de red de transporte dada en 


Fig. 2-9. Esquema de los caminos 


la tabla 2-2 en la que interpretaremos ahora las magnitudes di; 
como el tiempo requerido para trasladar la carga del punto x; al 
punto y; i las designaremos por f;;. Es posible confrontar proble- 
mas similares sobre el transporle de productos de fácil deterioro, 
el envío de medios de auxilio a regiones de cataclismos, el acarreo 
de granos de la nueva cosecha a los puntos de acopio, etc. En to- 
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Tabla 2-3 


Distribución de los flujos parciales en el 
problema de transporte por el criterio de costo 


å Ruta ä Gong det 
(a) 1 EN 

1 (es. 91) 5 1 5 

2 a ya) 10 1 10 

3 (xn Yu) 10 2 20 

4 (xs. y) 5 3 15 

5 (£a Ya) 15 4 60 

6 (x*z Ya) 5 6 30 

= = | 50 | - | 140 


das estas tareas es necesario trasladar todas las cargas a los lu- 
gares de destino en el más breve intervalo de tiempo. 


Fig. 2-10. Solución del problema de transporte por el criterio de costo 


Examinemos el método general de resolución de este problema. 
Supongamos que de cualquier modo se ha encontrado cierta distri- 
bución del flujo q. en el grafo G que representa la red de trans- 
porte considerada. Separemos del grafo G el grafo parcial G’ en el 
cual sólo incluimos los arcos que participan en la transmisión del 
flujo q.. Sea y cierto camino que conduce de xo a 2 y fw el tiempo 
de paso del fiujo por este camino. Evidentemente, el tiempo ne- 
cesario. para trasladar todas las cargas de xo a z va a determi- 
narse por el camino que tiene la mayor duración de paso del flujo 
ya que el traslado de las cargas por los demás caminos terminará 
antes. Por lo tanto, el tiempo 7, requerido para el transporte de 
todas las cargas será igual a: 


T= mia tu. (2-37) 
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La resolución del problema de transporte por el criterio del 
tiempo se reduce, de esta manera, a separar del grafo G, el grafo 
parcial G’ que sea capaz de dejar pasar todo el flujo q. y en el 
cual la duración del camino más prolongado sea minima en com- 
paración con todos los demás. grafos similares. Por cierto, la so- 
lución hallada por el criterio del costo antes descrito, que mini- 
miza la magnitud definida por la expresión (2-36), al mismo 
tiempo puede ser no la mejor desde el punto de vista del criterio 
del tiempo. 

La solución de la larea planteada se reduce al mejoramiento 
consecutivo del grafo G’, eliminando del mismo los caminos más 
prolongados e introduciendo los más cortos pero que no se han 
utilizado antes, y redistribuyendo correspondientemente el flujo q. 


Sirvámonos del ejemplo examinado. Tomemos a modo de primera aproxi- 
mación a la solución óptima, la solución obtenida basándose en el criterio del 


Fig. 2-11. Solución del problema de transporte por el criterio de tiempo 


costo. La distribución de los flujos para este caso se muestra en la figura 2-10, 
En esta figura vemos que el tiempo de paso del flujo por la ruta más prolon- 
Eada (xa, pa) es igual a 6. 

Sin embargo, quedaron sin utilizar las rutas menos largas (Xi 42). (Xp 
11), (xi, ys). Por eso puede ser que el empleo de cualquiera de estas rutas per- 
mita excluir la ruta (xs y). 

Construyamos el grafo parcial G’ en el cual sólo incluimos los arcos del 
grafo G que tienen fu < 6 y en el cual quedó la misma distribución del flujo 
que en el grafo G. El grafo G’ se muestra en la figura 2-11 donde, por conve- 
niencia, los vértices y, están designados por Xm+s = Xs+. El flujo q, a tra: 
vés de este grafo es igual a 45 unidades, o sea, menos que el flujo inicial qu = 
= 50 unidades. Este flujo es completo ya que en el grafo G’ todos los caminos 
de xo a z lienen arcos saturados. Sin embargo, puede que éste no sea el má- 
ximo, 
Si el flujo máximo en el grafo G’ es igual a qe, entonces se hallará una 
distribución de este flujo, con la cual el camino más prolongado va a durar ún 
tiempo f„ < 6 unidades. Por tanto, la solución ulterior del problema se reduce 
a determinar el flujo máximo en el graío G’. 

En la figura 2-11 se ha efectuado la marcación de los vértices del gralo 
G' en concordancia con la regla del $ 2-3. El marcado de los vértices indica 
la existencia de un camino (Xo, Xz, Xa, X3, xe, 2), en el cual el flujo en la direc- 
ción de xo a z puede incrementarse en 8 unidades, Este flujo adicional se mues- 
tra con flechas. Como vemos, el flujo máximo en el grafo G’ es p: = 50 uni- 
dades y la ruta más prolongada tiene un tiempo de 4 unidades. No es posible 
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Tabla 2-4 


Distribución de los flujos par 
en el problema de transporte 
por el criterio de. tiempo 


Ja Em EA 
(a Ya) 10 1 
10 2 
5 3 
5 4 
20 4 

- | q =50 | tmit 


lograr la disminución ulterior del tiempo de paso del flujo, ya que al vértice 
ys(xs) no van rutas con el tiempo menor de 4 unidades. 

En la tabla 2-4 se presenta la distribución definitiva de los ql parciales 
por las rutas que da la solución del problema de transporte según el criterio del 
liempo. 


Capítulo tercero 
ESPACIOS MULTIDIMENSIONALES 


3-1. ESPACIOS METRICOS Y DISTANCIAS 
a) Concepto de distancia 


El estudio de los conjuntos realizado en el capitulo 1 como re- 
unión de ciertos objetos tiene una aplicación limitada, ya que en la 
naturaleza todos los objetos materiales están en interrelación 
e interacción. Por eso, es necesario vincular el concepto de con- 
junto con el establecimiento de unas u otras correlaciones entre 
sus elementos. 

Se dice que un conjunto tiene estructura si entre los elementos 
del conjunto se han establecido determinadas relaciones o con los 
mismos se han definido ciertas operaciones. El conjunto que posee 
estructura se denomina espacio. 

Comencemos el estudio de los espacios por el tipo de espacios 
más sencillos llamados espacios métricos, para cuya definición es 
necesario introducir el concepto de distancia entre los elementos 
del conjunto. 

El hombre tropieza cada dia con el concepto de distancia rela- 
cionando este concepto con la distribución espacial de los objetos 
e interpretando por distancia la medida del alejamiento de los 
objetos, unos de otros. Generalmente la distancia d(M, N) entre los 
puntos M y N se mide por el largo del segmento que une dichos 
puntos (fig. 3-1). Sin embargo, tal distribución de la distancia con 


N 


£ 
Fig. 3-1. Representación del axioma del triángulo 


frecuencia resulta insuficiente. Así, incluso en usanza, la distancia 
entre dos ciudades no se determina univocamente (distancia por 
ferrocarril, vía marítima, fluvial, etc.). En una ciudad dividida en 
barrios como se muestra en la figura 3-2, no tiene sentido medir 
la distancia por medio del segmento de recta que une los puntos M 
y N ya que sólo es posible trasladarse por las calles. 

Por otro lado, frecuentemente no relacionamos la palabra ale- 
jamiento con el espacio en su sentido habitual, sino que nos refe- 
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rimos al alejamiento en el tiempo (en la profunda lejanía de los 
siglos, etc.) o en otro sentido. Si cierto sistema puede tomar su- 
cesivamente los estados A1, 42, -..., An, entonces podemos medir 
el alejamiento del estado A, respecto a A, con el número de esta- 
dos por los cuales debe atravesar el sistema para pasar del estado 
Aj al A». Aquí el estado va a ser la medida 
del alejamiento, uno del otro, de Jos esta- 
dos del sistema. Pero si se considera el 
alejamiento como propiedad del estado, 
nos vemos obligados a hablar no ya del 
espacio tridimensional habitual sino de 
algún otro espacio que se puede denomi- 
nar, por ejemplo, espacio de estados. 

En los ejemplos dados se ve que debe 
existir cierta definición general de la dis- 
tancia como medida del alejamiento de los 
objetos y, por consiguiente, también del p 3.2 Determinación de 
espacio en que existen estos objetos, con ja distancia en una ciu- 
esto, en distintas situaciones concretas dad dividida en barrios 
dichos conceptos pueden tener diferente 
contenido. Por cuanto las reuniones de diversos objetos constituyen 
conjuntos, los conceptos de espacio y distancia deben estar vincu- 
tados al concepto de conjunto. 


b) Definición de espacio métrico 


Sea X un conjunto arbitrario. El concepto de distancia entre 
los elementos de X se obtiene mediante la generalización de las 
propiedades fundamentales, que pueden esperarse intuitivamente 
del concepto de distancia y que pueden entenderse con facilidad al 
examinar la figura 3-1. 

Relacionemos con cada par de elementos de X cierto número 
real no negativo d >0. Este número se llama distancia o métrica 
en X si para cualesquiera x, y, z & X el mismo satisface las tres 
condiciones siguientes: 

1) d(x, y)= 0 cuando, y sólo cuando x = y (axioma de iden- 
tidad); 

2) d(x,y)= d(y,x) (axioma de simetría); 

3) para cualquier triada x, y, ze X se cumple d(x,y)=< 
< d(x,2) + d(z, y) (axioma del triángulo). 

Se llama espacio métrico al par (X, d), es decir, al conjunto X 
con la métrica d definida en éste. Los elementos del conjunto X 
se denominan puntos del espacio métrico (X, d). 

De la definición dada se deduce que el conjunto X sólo se 
transforma en espacio métrico cuando se ha introducido en él la 
métrica correspondiente d(x,y). Si en un mismo conjunto X se 
introducen distintas métricas, se obtienen asimismo distintos espa- 
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cios. Asi pues, los espacios representados en las figuras 3-1 y 3-2, 
tienen en calidad de elementos conjunto de puntos de un plano, 
pero poseen distintas métricas. 


c) Ejemplos de espacios métricos 


1. Sean x, y elementos cualesquiera del conjunto R de los nú- 
meros reales. El conjunto R puede transformarse en espacio métri- 
co si se determina la distancia entre x e y por la fórmula 


dix, y=/1x—yl (3-1) 


Precisamente por esta fórmula se halla la distancia entre los 
puntos del eje real que constituye uno de los más sencillos ejem- 
plos del espacio métrico. 

2) Examinemos el conjunto R” cuyos elementos son las n-es 
ordenadas de los números reales del tipo x= (xı, ..., Xn), Y = 
== (Y .-», Yn) »-- El conjunto R” puede transformarse en espacio 
métrico por distintos métodos. 

La distancia entre los puntos x e y se define muy frecuente- 
mente por la fórmula 


n Ye 
A inue. (62) 


En el caso de n = 2, 3 esta definición coincide con el concepto 
habitual de distancia. Las propiedades 1, 2 y 3 para esta distancia 
són evidentes al examinar la figura 3-1. 

La métrica d»(x, y) se denomina euclídea y el espacio R” con 
tal métrica se llama euclideo Y se designa por A 

3. Para el conjunto R” la distancia puede determinarse por 
otros métodos, por ejemplo así: 


a 
ae n= r (3-3) 
o bien 


diste, y) =máx (le = yil, -+ | Xa — Ya 1): 13-4) 


Es fácil ver que las métricas də, dı, dæ son casos particulares 
de la métrica 


5 uo 
d(x, =f Dlru yl 
& 


y se obtienen, respectivamente, con p = 2, p = 1 y p = %. 
Las propiedades | y 2 son evidentes para las métricas (3-3) 
y (3-4). Para demostrar la propiedad 3 introduzcamos un punto 
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más 2=(2, ..., 2n) ER”. Para la distancia d,(x, y) tenemos: 


NI 


<2lau—al+la—yl=d(s +de, y). 


Para la distancia du(x, y) la propiedad 3 se comprueba del 
modo siguiente. Supongamos que |xa — ya] es la mayor de las 
diferencias correspondientes de los puntos x e y. Entonces 


do (X, Y) =| Xa — Ya |=] Xa — Zr F Ze — yal S| Xr — Zr 14122 — ya le 

Es evidente que y 

Ixe — Ze |S máx (lx —21 l,- 

|2 — yr lS máx (l2: — yı l, + 
Luego, 


r IXa — Za 1) = do ($, 2); 
s ln — ya )= do (z. y). 


a (x, y) Sdo lX, 2) + do (2, y). 


4. Examinemos un conjunto de funciones del tiempo de todo 
género posible continuas en el intervalo a < f < b. Sean x(f) 
e y(t) dos de estas funciones. La distancia entre ellas puede de- 
terminarse mediante la relación 


dix y) már 10) y (3-5) 


que, como es fácil comprobar, satisface todas las propiedades de 
la métrica. El espacio con esta métrica se designa por Cia, s). 

Para ilustrar las posibilidades de utilizar en la práctica los 
conceptos introducidos conviene detenerse en un espacio suma- 
mente importante en cibernética que se denomina espacio de men- 
sajes. 


3-2. INTERPRETACION GEOMETRICA DE LAS SEÑALES 
Y MENSAJES 


a) Espacio de mensajes 


Como hemos visto en la Introducción, los mensajes se trans- 
miten por canales de comunicación con ayuda de cierto alfabeto A, 
que consta de un número finito de símbolos. Los mensajes consti- 
tuyen distintas secuencias de simbolos del alfabeto. El número de 
símbolos en un mensaje se llama largo del mensaje. 

Analicemos el caso en que con ayuda del alfabeto Um que consta 
de m símbolos se transmiten mensajes de largo n. Pueden catalo- 
garse también aquí los mensajes más breves si éstos se comple- 
mentan hasta el largo n con cierto símbolo determinado, por 
ejemplo, con el cero en caso de utilizarse el alfabeto binario, El 
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conjunto de todos estos mensajes puede considerarse como espacio 
métrico si se introduce el concepto de distancia entre mensajes. 

Llamemos distancia d(x,y) entre dos mensajes x e y al nú- 
mero de posiciones en las cuales los mensajes x e y tienen diferen- 
tes simbolos. El espacio métrico obtenido en este caso se designará 
por E(n, Am) y se llamará espacio de mensajes. 

Ejemplo 3-1. Um es el alfabeto ruso, n = 7, x = (xaptuna), y = (xop- 
sma). No coinciden la segunda y cuarta jetras, Luego, d(x, y) = 2. 

jjemplo 3-2. Sea A = Az =(0,1) el alfabeto binario, n==10, x= 
= 0100111010, y == 0010110010. No coinciden el segundo, tercero y séplimo sig- 
nos. Por tanto, d(x, y) = 


La definición dada de la distancia d(x,y), en el espacio de 
mensajes, satisface todas las propiedades de la distancia. El axio- 
ma de identidad y el de simetría resultan evidentes. Cerciarémonos 
de que también se cumple el axioma del triángulo. 

Examinemos tres mensajes x, y, z de largo n. Designemos por 
Xr Yr Y Zn los símbolos de k-ésima posición de estos mensajes. 
Naturalmente, si Xa = yn € Ya = 2», entonces Xa = Za, es decir, si 
en alguna posición coinciden los simbolos de los mensajes x, y, 
y de los mensajes y, z, entonces en dicha posición coinciden tam- 
bién los simbolos de los mensajes x y z. Por lo tanto, en los men- 
sajes x y z solamente pueden haber símbolos que no coinciden en 
aquellos lugares donde no coinciden los simbolos bien en los 
mensajes x, y, bien en los mensajes y, z. Pero esto significa que el 
número total de símbolos no coincidentes en los mensajes x y z 
no puede sobrepasar la suma de números de los símbolos no coin- 
cidentes en los mensajes x, y e y, 2. 

En lo sucesivo, con fines de simplicidad y claridad, nos limita- 
remos únicamente al análisis del alfabeto binario A = Az = (0, 
Esto puede hacerse sin detrimento de la generalidad de los razo- 
namientos ya que los mensajes representados por símbolos de un 
alfabeto siempre pueden recodificarse como mensajes representa- 
dos mediante símbolos de otro alfabeto. Examinemos, por ejemplo, 
el alfabeto Am que contiene m símbolos. Yuxtapongamos a cada 
símbolo un número de orden de 0 a m — 1. Si se sustituyen en el 
mensaje los símbolos del alfabeto Am por sus números de orden 
en el sistema de numeración binario, obtenemos ia representación 
del mensaje en el alfabeto binario. 


b) Concepto de códigos estables a las interferencias 


En el proceso de transmisión por un canal de comunicación 
puede distorsionarse el mensaje. En el caso del alfabeto binario 
la distorsión consiste en que en el mensaje captado algunas unida- 
des resultan cambiadas por ceros y algunos ceros por unidades. 
Surge la cuestión de si pueden elaborarse códigos que permitan 
descubrir que en el proceso de la transmisión ocurrió una distor- 
sión o hasta restablecer los valores de los dígitos distorsionados. 


EJ 


Los códigos que poseen estas propiedades se denominan estables 
a las interferencias. i 
Examinemos el caso en que durante el proceso de transmisión 
del mensaje no puede ocurrir una distorsión mayor que en k digi- 
tos. En el espacio de los mensajes E(n, ùz) separamos el subcon- 
junto Ha = E (n, Az) que posee la propiedad de que para x, y € Ha 
cualesquiera, se cumple: 
dix, y)> k. (3-6) 


Llamemos al conjunto Ha conjunto de palabras comprensibles. 
Aqui el término “palabra” es sinónimo del término “mensaje”. 
Entonces cualquier x gs Ha es una palabra incomprensible. Supon- 
gamos que al transmitir la palabra £ <= Ha ésta se distorsionó y 
convirtió en la palabra x. Como que por hipótesis no pueden ocu- 
rrir más de k distorsiones, entonces d(x, x’) < k y x’ £ Hr, o sea, 
x’ es una palabra incomprensible. Así pues, la recepción de una 
palabra incomprensible denota que ocurrió una distorsión en el 
proceso de transmisión. Los códigos que satisfacen la condición 
(3-6) se denominan códigos con detección de error. 


Ejemplo 3-3, Separemos del código E(3, sta) el siguiente conjunto de pa- 
labras comprensibles que satisfacen la condición d(x, y) == 2: 


H, = (000, 101, OML, 110). 


La distorsión de cualquiera de los digitos en estas palabras las convierte 
en incomprensibles, o sea, permite detectar un error sencillo 

El conjunto Hı que forma un código con detección de error sencillo en pa- 
labras de largo n puede obtenerse del modo siguiente. Examinemos el conjunto 
E(n—1, Us), es decir, el conjunto de palabras de largo n—). El conjunto Hı 
se obtiene añadiendo a dicho conjunto un dígito más cuyo valor se elige de 
modo que sea par el número total de unidades en las palabras x e Hi. 

Ejemplo 3-4. Para n = 4 tenemos: 


E (3, Ra) = (000, 001, 010, 100, 011, 101, 110, 111). 
H, = (0000, 0011, 0101, 1001, O110, 1010, 1100, 1111). 


Es cómodo descubrir la palabra distorsionada con ayuda de la operación 
de adición por el módulo 2 según las reglas: 


090=0:091=1,190=1 191=0 (3-7) 

Así pues, en la palabra x = aias... an la magnitud 

b=a4D00... Dan 
será cero o unidad dependiendo de si tienen el valor de la unidad un número 
par o impar de símbolos de la palabra. 

Observemos que el código de cuatro dígitos con detección de 
error que se obtuvo en el ejemplo 3-4, brinda la posibilidad de 
componer 2* = 16 palabras diferentes, aunque en calidad de pa- 
labras comprensibles, o sea, destinadas a transmitirse por el canal 
de comunicación, se utilizan solamente 8. Los códigos en los que 
el número de palabras comprensibles es menor que el total de 
palabras posibles, recibieron la denominación de códigos con re- 


a 


Por cierto 


dundancia. La existencia de redundancia es condición necesaria 
para la elaboración de códigos estables a tas interferencias. 

Resulta igualmente posible elaborar códigos que permitan co- 
rregir los errores cometidos. Supongamos nuevamente que en el 
proceso de transmisión puedan distorsionarse no más de k dígitos 
del código. El conjunto de palabras comprensibles Hı = E(n, As) 
se elige por la condición 


d(x, y)>2% (3-8) 


para x, y = Hn cualesquiera. 

Consideremos dos palabras cualesquiera x, y = Hs. Suponga- 
mos que como resultado de una distorsión x se convirtió en x’. 
Entonces, d(x, x’) < k. Por la desigualdad del triángulo obtene- 
mos: 


d(x, y>d(x y)— dix, x) >2k—=k=k. (3-9) 


Consecuentemente, 
dix, x) <a, y). (8.10) 


De esta manera, la distancia desde la palabra equivocada x” 
hasta la x que ha sido sometida a distorsión, es menor que hasta 
cualquier otra palabra comprensible. Hallando la palabra com- 
prensible más cercana a x’, nosotros, de este modo, restablecemos 
el mensaje concreto x, Los códigos que satisfacen la condición 
(3-8) se denominan códigos con corrección de errores. Las cues- 
tiones de la realización práctica de los códigos con corrección de 
prrores son bastante complejas y se estudian en literatura especia- 
izada. 


3-3. ESPACIOS LINEALES NORMADOS 


a) Espacio lineal 


Al comienzo del capítulo se definió el espacio como conjunto 
dotado de una estructura determinada. Se estudiaron los espacios 
métricos cuya estructura se determinaba por el hecho de que a 
cada par de elementos se atribuía un número real llamado métrica 
que satisfacia delerminadas propiedades. No obstante, la introduc- 
ción de la métrica está lejos de agotar todas las propiedades es: 
tructurales de los diversos espacios. En particular, si el conjunto X 
consta de números reales o complejos, se incluyen entre las pro- 
piedades estructurales de importancia la posibilidad de obtener 
elementos del conjunto a partir de otros mediante la adición de 
estos elementos, o la multiplicación de un elemento por un escalar. 
Los conjuntos que tienen dichas propiedades pertenecen a la clase 
de los espacios lineales. Los espacios lineales deben satisfacer las 
condiciones siguientes: 
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1) para cada par de elementos, x, y  X está definido univoca- 
mente un tercer elemento z = X que se denomina su suma y se 
designa por x + y, siendo que 

x + y = y + x (conmutatividad); 

x + ly +0) =(x + y)+ v (asociatividad); 

en X hay un elemento O tal que x +0 = x para todas las x=X 
(existencia del cero); 

para cada x= X hay un elemento —x tal que x +(—x)=0 
(existencia del elemento opuesto); 

2) para cualquier número œ y cualquier elemento x € X está 
determinado el elemento ax e X siendo que 


(a +p) x= ax +Bx; 
alx + y) =ax+ ay. 


Las condiciones 1) y 2) se denominan condiciones de aditivi- 
dad y homogeneidad del espacio lineal. 

Pueden servir de ejemplos de espacios lineales: 

1. El conjunto de números reales R con la definición habitual 
de las operaciones de adición y multiplicación. 

2. El conjunto R» de todas las n-es ordenadas de los números 
reales, si las operaciones de adición y multiplicación por un nú 
mero están definidas del modo siguiente. Si x, y ER” y x 
= (Xi ..., Xn), Y = (Yi, -- -» Ya), entonces, x + y = (x1 + Y... 

> Xn H Ya); ax =(UX1, .... 0Xn). 

Para n = 2 y n = 3 estas operaciones coinciden con las reglas 
habituales de operación con vectores. Se entiende por vector nulo 
el vector (0, ..., 0) con componentes iguales a cero. 

3. El espacio de las funciones Cra, o, si para x (f), y() € Cia, s 
cualesquiera se entiende por x(1)+ y(t) la suma de los valores 
x(t) e y(£) tomados con los mismos valores de £, y por ax(f) se 
comprende una nueva función obtenida de x(f), multiplicando to- 
dos sus valores por æ. La función nula será f(/) = 0 que es idénti- 
camente igual a cero en todo el intervalo (a, b]. 


b) Espacio lineal normado 


El espacio lineal sólo recibe su descripción definitiva cuando 
las propiedades de aditividad y homogeneidad están complementa- 
das por la posibilidad de medir la magnitud de los propios elemen- 
tos. Así pues, no podemos comparar vectores si no convenimos en 
qué se comprende por magnitud (largo) del vector. La introduc- 
ción en el espacio lineal de los estimados numéricos de las magni- 
tudes de tos distintos elementos conduce al concepto de espacio 
lineal normado denominado a veces espacio de Banach. 

El espacio lineal se denomina espacio lineal normado, si para 
cada x = X existe un número no negativo Ilxll llamado norma x, 
que satisface las condiciones siguientes: 
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lx [| = 0 cuando, y sólo cuando x = 0; 

laxi = jal- l xI; 

lx+ yl s ixil iy il (desigualdad del triángulo). 

No es difícil establecer que la magnitud lix — yl posee todas 
las propiedades de la distancia d(x, y) en el espacio métrico. 
Efectivamente: 

Ilx — y || = 0, si x — y = 0, es decir, si x = y; 

teniendo en cuenta que y — x = — (x — y), hallamos: 


Uy—x=1—11-1x—yll=1x— y lb 
lx—yli=1X—2)+(—y91<Ix—z+li2— yl. 


Por tanto, el espacio lineal normado es un espacio métrico con 
métrica 


dix, y) =Ix— yl (3-11) 


Todos los espacios métricos anteriormente examinados comple- 
mentados con las propiedades de aditividad y homogeneidad, se 
transforman en espacios lineales normados. Para dichos espacios 
se emplean notaciones especiales, a saber: 


1) el espacio CS” o E, con la norma 


à h 
11=(E ne) o lIxl=1x|paran=1; (3-12) 


2) el espacio Cf con la norma 


ld 2 lrk (8-13) 
3) el espacio C con la norma 
lxil = máx {|x h ..., ltal} (3-14) 


4) el espacio Cia, yy de las funciones continuas definidas en el 
intervalo [a, b] con la norma 


1ji= I FOI (8-15) 


3-4. APLICACION DE LOS ESPACIOS 
MULTIDIMENSIONALES EN ALGUNOS PROBLEMAS 
DE CIBERNETICA 


a) Atenuación de errores en datos experimentales 


Los resultados de las observaciones de cierta magnitud física y 
son corrientemente una secuencia de valores medidos de esta mag- 
nitud (xa, » -. + Xa) = x, por cierto, los resultados de las mediciones 
habitualmente contienen errores provocados por las imperfecciones 
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del experimento y la influencia de diversos factores extraños. La 
misma magnitud y puede no permanecer constante sino variar 
según cierta ley. El objetivo del experimento es establecer el valor 
real de la magnitud observada. 

La situación descrita puede representarse en términos de la 
teoría de la transmisión de mensajes si se considera y como cierto 
mensaje acerca del valor de la magnitud a medir, sobre el cual se 
superponen las distorsiones debidas a las imperfecciones del expe- 
rimento. Representando el mensaje transmitido y y el recibido x 
en forma de puntos del espacio de mensajes, puede estimarse el 

rado de distorsión del mensaje recibido con ayuda del valor de la 
istancia d(x, y) cuyo método de determi- 
nación depende del carácter del experimen- 


to realizado. Con mucha frecuencia se uti- A 
liza distancia del tipo 

d(x, y= 

=P, (8-16) m 
con la cual el espacio de mensajes se £ 
transforma en espacio CY”. tr la Te 


Por lo general, mediante consideracio- 
nes teóricas, se logra establecer el conjun- Fig: 33. Determinación de 
to de los mensajes teóricamente posibles Y. — señal” que. varia lineal- 
En este caso debe tomarse como mensaje mente 
correcto tal y & Y que sea más cercano al 


mensaje recibido x, es decir, para el cual 


d(x, y) =mín, (3-17) 
o, lo que es a veces más conveniente, 
di=(x, y)= hin. (3-18) 


El principio de determinación del mensaje verdadero y por la 
fórmula (3-18) para la distancia del tipo (3-16) se utiliza amplia- 
mente con el nombre de método de los cuadrados mínimos. 

Examinemos a modo de ejemplo el caso de importancia prác- 
tica en que la magnitud y varía según la ley lineal: 


y=at+b. (3-19) 
En los momentos fi, ..., fn se miden Jos valores ya = at, + b, 
k= l, ..., n. Los resultados de las mediciones xı, ..., Xn están 


representados en la figura 3-3. 
Tomando en consideración (3-19) la condición (3-18) se escribe 
en la forma 
p 
d(x, y) =F (a, b) = Ñ, (£ — atg — b} = min. (8-20) 
A 
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En esta expresión son incógnitos los parámetros a y b de la 
ley lineal buscada de variación de la magnitud y. Igualando a cero 
las derivadas parciales por a y b de la función F (a, b), obtenemos 
dos ecuaciones que contienen ambas incógnitas y que después de 
simplificarlas adquieren la forma: 


a a a 
2 == A 
aL Btb h È fatai 


i 
aÈ ttn 2 xe 


No es difícil determinar en (3-21) los valores de a y b, que nos 
interesan. 

Otro caso importante tiene lugar cuando la magnitud y se 
mantiene invariable, es decir, 


(3-21) 


y=c= const (8-22) 


y para su estimación se han realizado n mediciones independientes 
Z ..., Xn. Teniendo en cuenta (3-16) la condición (3-18) se 
escribe en la forma 


Pl =F c) = È (a — c} = min. (3-23) 


Diferenciando esta expresión por c e igualando a cero, ha- 
amos; 


(3-24) 


El valor c determinado por la fórmula (3-24) se denomina me- 
dia aritmética de los valores xi, ..., Xn. 

Con una definición distinta de la distancia se obtienen otras 
fórmulas para determinar la media. Para mayor comodidad vamos 
a considerar que las magnitudes Xi, ..., Xn están dispuestas en 
orden creciente de sus valores. Proponemos al lector cerciorarse 
por sí mismo de que al determinar la distancia por la fórmu- 
a (3-3) el valor medio 


ž ngt para n impar; 
de 


cualquiera de ta | a Xa (3-25) 
2 2 


+, Para n par. 


A veces para ser más concretos para n par se supone que 
1 
emy (ta, tte y (3-26) 
a(g tign) S2 
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Si la distancia se determina por la fórmula (3-4), la fórmula 
para la media es: 


Xit Xn 
=p, (3-27) 


b) Problema de identificación de imágenes 


La rama de la cibernética que se ocupa de la identificación de 
imágenes tiene como objetivo simular una de las propiedades más 
importantes del cerebro humano, la propiedad de identificar los 
objetos, fenómenos y situaciones que permiten al hombre orien- 
tarse en situaciones ambientales complejas. 

Los conceptos fundamentales de la {eoria de identificación son 
los de clase e imagen. Los diversos objetos o fenómenos del mundo 
real difieren unos de otros por sus propiedades. Al mismo tiempo 
los distintos objetos y fenómenos tienen asimismo propiedades ge- 
nerales que permiten agrupar los objetos en ciertos conjuntos 
o clases. Así pues, los diferentes tipos de automóviles se reúnen 
en la clase de los automóviles. Las clases pueden ser de diverso 
grado de generalidad dependiendo de las propiedades que se les 
atribuyen. Así, la clase de los automóviles es un elemento de la 
clase más amplia de los medios de transporte. De este modo, se 
denomina clase un conjunto de objetos o fenómenos reunidos 
según ciertas propiedades comunes. 

En cada situación concreta es necesario operar con un juego 
finito de clases expresadas por el conjunto finito 


W=(A,B,C,..., P}. 


Cada clase incluye en sí un conjunto de objetos cuyo número 
puede ser tan grande como se quiera y cuyas propiedades son su- 
mamente variadas. Sin embargo, en lá práctica sólo resulta posible 
tomar en consideración un número limitado, y con frecuencia muy 
pequeño, de propiedades diferentes. Llamaremos imagen o modelo 
del objeto al número total finito de propiedades del objeto, y repre- 
sentaremos la imagen en forma del vector de n dimensiones 
x= (xi, ..-, Xa) cuyas componentes caracterizan cuantitativa- 
mente las propiedades de la imagen. Puede servir de ejemplo de 
imagen la señal de televisión de una fotografía dividida en n cel- 
das independientes. El total del brillo de luminiscencia de las cel- 
das forma un punto en el espacio de n dimensiones constituyendo 
la imagen de la fotografía. 

Puede esperarse (por supuesto, con la condición de que el total 
de los índices caracterice bastante completamente las propiedades 
de los objetos), que la totalidad de los puntos correspondientes 
a las distintas imágenes de una misma clase, va a ocupar en el 
espacio de imágenes cierto dominio que difiere de los dominios 
correspondientes a las imágenes de otras clases. 
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El problema de identificar las imágenes puede considerarse 
solucionado en principio si en el espacio de imágenes se han hecho 
pasar planos que lo dividen en dominios cuyos puntos pertenecen 
a imágenes de clases diferentes. Uno de los métodos posibles de 
resolución de este problema es el estudio previo de las propiedades 
de las distintas imágenes de los objetos de cada clase. 

Supongamos que existen sólo dos clases de objetos A y B. 
Designemos por Ao y Bo los conjuntos de los modelos de estas 
clases previamente estudiados. Las representaciones de dichos mo- 
delos en el espacio de imágenes pueden tener el aspecto mostrado 
para el caso de dos dimensiones en la figura 3-4, a, donde los pun- 
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Fig. 3-4. División del espacio de modelos en clases 


tos correspondientes a los modelos de Ay están designados por 
círculos y de Bo, por triángulos. 

Sea x la imagen del nuevo objeto a investigar. Se toman como 
medida de la cercanía de esta imagen a las clases A y B las 
magnitudes S(x, A) y S(x, B) que representan, por ejemplo, los 
cuadrados medios de las distancias del punto x y los puntos co- 
rrespondientes a las distintas imágenes de las clases A y B. Asi 

ues, si Ao = (ar, ..., am) y Bo = (bj, ..., b} por la fórmu- 
a (3-24) para el valor medio obtenemos: 


St, A= LY Pe, ad; 


a 


ñ 
LS dix, bp). | 


fal 


(3-28) 
Síx, B) 


La superficie que separa las imágenes de ambas clases, en el 
espacio de imágenes será una superficie C cuyos puntos satisfacen 
la condición 


S(x, A)=S(x, B). (3-29) 
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Como se ve en la figura 3-4, a, en algunos casos la superficie C 
será tal que pueda referirse por error la imagen a una clase 
ajena. Puede servir de criterio de calidad de identificación el nú- 
mero relativo de imágenes identificadas incorrectamente. 


Ejemplo 3-5, De cada clase A y B se toma un modelo de a EA y b EB 
ue expresan en el espacio bidimensional las propiedades más características 
de estas clases, Trace una linea que divida el espacio de imágenes en dos domi- 
nios correspondientes a las clases A y B. 

Se determina la distancia aplicando ia fórmula (3-2) por la longitud del 
segmento que une dos puntos en el espacio de imágenes Según (3-20), la línea 
divisoria será aquella todos los puntos de la cual están alejados a una distan: 
cia igual de tos puntos a y bs. Esta línea será la perpendicular construida a 
partir de la mitad del segmento que une los puntos a, y bı (Sig 3-4, b). 


3-5, IMAGENES GEOMETRICAS EN EL ESPACIO 
MULTIDIMENSIONAL 


a) Concepto de hiperesfera 


Sea X cierto conjunto de puntos en el espacio multidimensional. 
Se llama hiperesfera la superficie cerrada todos los puntos de la 
cual están alejados a la misma distancia r de cierto punto fijo a. 
Por consiguiente, la hiperesfera es el conjunto X (a, 1) = E, que se 
determina como 


X(a, r)=(x E, :d(a, =r} (3-30) 

El punto fijo a se denomina centro y r, radio de la hiperesfera, 
El conjunto 

Bla, ù= (xE B, :día, x)<r) (3-31) 


se llama parte interior de la hiperesfera o esfera abierta. El con- 
junto 


Bla, r]=(x=E,:d(a, x) <r} (3-32) 


se denomina esfera cerrada. 

La esfera abierta de radio e con centro en x se llama vecindad 
del punto x y se designa por Oe (x). 

Ejemplo 3-6. En el espacio Ez == (xs, xo) la ecuación de la hiperesfera se 
puede escribir en la forma de (a. x) = r. SI la distancia se determina por la 


¡órmula (3-7) la hiperesfera se convierte en esfe: a4)? + (xa — m)? = 
=r 


b) Conjuntos limitados y finitos 


Vamos a denominar conjunto universal el conjunto E, que re- 
presenta una reunión infinita de los puntos del espacio de n dimen- 
siones. Designemos por X cierto subconjunto del conjunto En. El 
conjunto X se llama limitado si está limitada la distancia entre 
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dos puntos cualesquiera de dicho conjuñito, es decir, sí existe un 
número M tal que para cualesquier 0, x® = X se cumple 

dih, 2) <M. (3-33) 

Puede demostrarse que la condición necesaria y suficiente para 

limitar el conjunto X es que el mismo esté en cierta hiperesfera, 


o sea, la existencia de un punto a y un número r tales que para 
cualquier x = X se cumple 


d(x, a) Sr. (8-34) 
El conjunto X se denomina finito si contiene un número finito 
de puntos. El conjunto finito siempre es limitado. 
Ejemplo 3-7. En el espacio Fa el conjunto X=((x,, 19) Ez: x? + x3 <1} 
es un conjunto infinito limitado. 


Ejemplo 3-8. En el espacio Ea el conjurito X que consta de cinco puntos 
X = ((0,0), (0,1), (1,0). (1,1), 0/, /2)), es un conjunto finito. 


c) Conjuntos abiertos y cerrados 


El punto x se denomina punto interior del conjunto X si existe 
la vecindad O, (x), todos los puntos de la cual pertenecen a X, Se 
Mama conjunto abierto al conjunto X todos los puntos del cual son 
interiores. 

Ejemplo 3-9. El intervalo (a,b) =(x=R:a <x < b}, en que R cs el 
conjunto de los números reales, constituye un conjunto abierto, Efectivamente, 
para cualquier xæ (a,b) la vecindad Oe(x) en la cual e= nin(r— a, b — x) 
pertenece por completo a (a, b). 

Ejemplo 3-10. La estera abierta B(a,r) es un conjunto abierto. Efectiva- 
mente, si xs Bía,r), entonces d(a,x) < r. Supongamos que e =/—d(a,x), 
entonces Op (x) = Blx,u) E Bla, r). 


El punto x se denomina punto limite del conjunto X si cual- 
quier vecindad O,(x) de aquél contiene un número infinitamente 
grande de puntos de X. Si con esto x= X, entonces el mismo se 

lenomina punto límite perteneciente a X. Así pues, todos los pun- 
tos interiores del conjunto X son puntos límites pertenecientes a X. 

Si x es un punto límite det conjunto X y a X, este punto se 
denomina limite no perteneciente al conjunto Tales puntos se- 
rán, por ejemplo, los puntos a y b del conjunto (a, b). Un con- 
junto finito no posee puntos límites. 

El conjunto X se ilama cerrado si contiene todos sus puntos 
límites. Pueden servir como ejemplos de conjuntos cerrados cual- 
quier segmento [a, b) de la recta numérica, la esfera cerrada Bla, r] 
o cualquier conjunto finito. 


d) Concepto de hiperplano 


El hiperplano es la generalización del concepto de plano para 
el espacio multidimensional. En geometría analitica se demuestra 
que cualquier ecuación lineal con respecto a las coordenadas de- 
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fine un plano. Si las coordenadas del punto corriente son Xi, x2, Xa 
la ecuación del plano en el espacio tridimensional es de la forma 


ax + xa + y = C. (3-35) 


Si el juego fijo de números (a;, a», as) se entiende como vec- 
tor a trazado desde el origen de coordenadas a un punto con coor- 
denadas a, & Y as, y Como x =(X1, X2, Xa) se comprende el vector 
que determina la posición del punto corriente en el espacio Es, 
entonces el primer miembro de la ecuación (3-35) va a constituir 
el producto escalar de los vectores a y x, y la ecuación 


ar=c (3-33) 


será la ecuación vectorial dei plano perpendicular al vector 
a =(4;, aa, 03). 

En caso del espacio multidimensional E, la ecuación (3-63) va 
a definir el hiperplano perpendicular al vector fijo a= (a, An 
cuyas coordenadas corrientes están definidas por el vector x = 
= (Xi, --+, Xn). Designando el conjunto de los puntos del hiper- 
plano por L(x) y desarrollando el producto escalar de los vectores 


a y x llegamos a la siguiente definición de hiperplano; 
L@= fret: $ au—e=0). (3-37) 
Los conjuntos 
a 
[re È am—e>0} (3-38) 
y 
E fzer, E am—e<0} (3-39) 


se denominan semiespacios abiertos determinados por el hiper- 
plano £. 


e) Ecuación del segmento. 
Concepto de conjunto medio ponderado por elementos 


La ecuación de la recta que pasa por los puntos x y x® en el 
espacio En se obtiene si se toma en ella el punto x que divide el 
segmento (xÙ, xD) en la relación w: 1 — w. Como que la relación 
de los segmentos de recta será la misma que la relación de sus 
proyecciones sobre los ejes de coordenadas, para las proyecciones 
sobre el eje k se llega a la relación 
n 


PEEN 
r A pr En) 

o bien 
xy =(1—0)xp +. (3-41) 
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Suponiendo que k = 
ciones que define la rect 


x= —0) Ah A w } 


--» n, obtenemos el sistema de ecua- 


A e A (3-42) 

x, = (1 — w) 04 wx, 

Este sistema de ecuaciones puede escribirse de modo mås com- 

pacto en forma vectorial 

(19402. (3-43) 

La ecuación (3-43) es la de la recta que pasa por los puntos 

x0) y x(2, por cierto, como se muestra en la figura 3-5 a diferentes 

valores de w van a corresponder distintos puntos de dicha recta. 

En particular, para 0 < w < l esta ecuación define el seg- 
mento limitado por los puntos x) y x®, 


22 


Fig. 3-5. Valores de w en los distintos puntos de la recta 


Lo más cómodo es escribir la ecuación del segmento en la 
forma 


=0x040 wm, wm>0 +=. (3-44) 


La magnitud x definida por (3-44) se denomina media ponde- 
rada por los elementos xP y x® con pesos w, y ws. Esta denomi- 
nación tiene un sencillo sentido físico. Si en los puntos x® y x® 
se colocan pesas con los pesos w; y wz, entonces el punto x deter- 
mina el centro de gravedad del sistema. 

El concepto de media ponderada puede extenderse también 
a un número mayor de puntos. Vamos a llamar media ponderada 


por los elementos xD, ..., x0 a la magnitud x definida por la 
relación 
P m 
z=} wh, w> 0, 1. (3-45) 
E E 


3-6. CONJUNTOS CONVEXOS Y SUS PROPIEDADES 


a) Definición de conjunto convexo 


Sea X cierto conjunto en el espacio E. El conjunto X se de- 
nomina convexo, si el segmento que une dos puntos cualesquiera 
de este conjunto pertenece íntegramente a dicho conjunto. En otras 
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palabras, X es un conjunto convexo si para cualesquier x0, > X 
y 01, w >0, w + w = 1 se cumple wx + wa” E X. 

Los ejemplos de conjuntos convexos en el espacio Es = ((x, y) 
son: 2 < lx y? < l; todo el plano Es; los semiplanos 
axr+by—c>0y ax +by—c<0 (fig. 3-6, a). Por otra parte, 
no son convexos ambos conjuntos definidos por las ecuaciones 
tyh, *4+y=1 (fig. 3-6,b). Efectivamente, el punto 
(0, 0) que no pertenece a estos conjuntos pertenece al segmento 
que une los puntos (1, 0) y (—1, 0) de dichos conjuntos. 

Teorema 3-1. La intersección de conjuntos convexos es un con- 
junto convexo, 

Demostración. Examinemos la intersección X N Y de los con- 
juntos convexos X e Y. Sean x e y dos puntos arbitrarios de X f Y. 


a) 


Fig. 3-6. Ejemplos de conjuntos convexos (a) y no convexos (b) 


Entonces ellos pertenecen tanto a X como a Y. Por cuanto los 
conjuntos X e Y son convexos, el segmento que une los puntos x 
e y pertenece integramente tanto a X como a Y, y por eso, a la 
intersección X N Y. Por consiguiente, X N Y es un conjunto con- 
vexo. 


b) Envoltura convexa de un conjunto finito 


Sea A = {an ..., am} el conjunto finito de puntos en el espa- 
cio En. El conjunto finito no es convexo. No obstante, los puntos 
del conjunto finito A pueden ser elementos de algunos conjuntos 
convexos, por ejemplo Sı, S2, etc., como se muestra en la figura 3-7. 
En este caso Á es un subconjunto de los conjuntos convexos Si, 


Beee 

Se denomina envoitura convexa co(4) del conjunto A la inter- 
sección de todos los conjuntos convexos cuyos subconjuntos es A. 
En particular, si A Sı y A C Sa, entonces co(4)= Si N S2. 

De la definición dada se infiere que la envoltura convexa co(4) 
es el conjunto convexo menor que contiene A. En efecto, si hubiera 
un conjunto convexo S tal que A Œ S y S<=co(A), entonces se 
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cumpliria que co(A)= S N co(4), es decir, co(A)= S. De aquí se 
deduce que S = co(A). 

Teorema 3-2. La envoltura convexa del conjunto finito A es el 
conjunto de las medias ponderadas por elementos del conjunto A. 


Sean A =(4,, ..., Gm) un conjunto finito y w; ¿=1,..., m 
números reales tales que 
m 
> 2 w=. (3-46) 
La magnitud 
x= È wa (3-47) 


se denomina media ponderada por elementos del conjunto A. El 
conjunto S cuyos elementos son las magnitudes x determinadas 

por la fórmula (3-47) para todas las w 
posibles en el marco de las limitaciones 
(3-46), constituye el conjunto de las me- 
dias ponderadas por elementos del 
conjunto A. Se requiere demostrar 
que 


S= co (A). (3-48) 

Binas Pieria obinia Demostración. Para que el conjun- 
de la envoltura convexa de to S sea la envoltura convexa del A, 
un conjunto finito aquél deberá ser, en primer lugar, con- 


vexo y, en segundo, el menor conjunto 

convexo que contiene el conjunto A. Demostremos que se cumplen 
ambas condiciones. 

1. Tomemos dos sistemas arbitrarios de pesos w, y w, que 


determinan dos puntos del conjunto S: 
m m 
r=} Wap X= È wia, (3-49) 
f= = 
Tomemos el punto arbitrario x” del segmento que une x y x”: 


a m 
= weh 0 =2, [0 o) w H owi] a, = È wrar (350) 
donde 

wy = (1 — w) w, + ww). (3:51) 


La magnitud wọ no es negativa ya que representa la media 
ponderada de dos números no negativos w: y w. Además, 


¿UU +0 w= 5 


(3-52) 


De este modo x” es la media ponderada por elementos del con- 
junto A, es decir, eS. Por consiguiente, S es un conjunto 
convexo. 

2. Sea T un conjunto convexo arbitrario que contiene A. De- 
mostremos que el mismo también contiene S. 

Por hipótesis todos los elementos a; están contenidos en 7. 
Más adelante, el elemento 


e 7 (8-53) 


wit wr wtw 


es la media ponderada de a, az = T, de modo que x Œ T. Proce- 
diendo exactamente igual obtenemos que 


+0; mw 
TEE TE TOS 
EFA EA CAN 
TETERA TEMITE E O00 


es la media ponderada de xz, as ET, de manera que xy E T. Pro- 
siguiendo el examen de esta secuencia de puntos, hallamos que el 
punto 


Xm = Mton +20 tna + + En Foy mn 2 wares 
(3-55) 


pertence asimismo al conjunto T. De esta suerte, cualquier x= S 
también pertenece a T, o sea, S & T. Pero 7 es un conjunto con- 
vexo arbitrario que contiene A. Conse- 
cuentemente, S es el conjunto convexo 
menor que contiene A. 

El teorema dado permite determinar 
qué aspecto tiene la envoltura convexa 
del conjunto finito. Consideremos el ca- 
so bidimensional. En la figura 3-8 se 
muestran el conjunto finito A = fai, ay, 
Ag, a4, as} y el polígono convexo cuyos 
vértices son los elementos del conjun- 
to A. Es fácil ver que cualquier punto 
en un vértice, un lado o en el interior de 
un polígono convexo puede representar- Fig. 38 Envoltura de un 
se como la media ponderada de, por lo conjunto finito 
menos, tres de sus vértices. 

Asi pues, xo= med. pon(a;, az), xı = med. pon(xo, as) = 
= med. pon (dı, az, as). Al mismo tiempo el punto xe que está 
juera del polígono no puede ser la media ponderada de dos puntos 
interiores ningunos y esto significa que no puede expresarse como 
la media ponderada de los vértices del polígono. De este modo, la 
envoltura convexa del conjunto finito A en el plano es el polígono 
cuyos vértices son los elementos del conjunto A. 
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Esta deducción se generaliza fácilmente para el caso de un es- 
pacio arbitrario En. La envoltura convexa del conjunto finito A en 
el espacio En es el poligono convexo cuoys vértices son los elemen- 
tos del conjunto A. Cualquier punto interior o límite de tal poli- 
gono puede ser representado como la media ponderada de no más 
de (n— 1) vértices. 


4 

de 
Fig. 3-9. Para la construc- Fig. 3-10. Rectas de apoyo al 
ción del hiperplano de apoyo conjunto convexo 


Para concluir enunciemos sin demostración dos teoremas que 
serán utilizados para fundamentar una serie de preceptos de la 
programación lineal y de la teoría de los juegos. 

eorema 3-8 (teorema del hiperplano de apoyo). Sea S un con- 
junto convexo y O un punto arbitrario que no pertenece a S. El 
teorema afirma que existe un hiperplano L que pasa por O, tal 
que S está en uno solo de los semiplanos determinados por L 
(para los espacios bidimensional y tridi- 
mensional esto resulta intuitivamente claro 
por la fig. 3-9). 

Vamos a desplazar el hiperplano en el 
espacio acercándolo a S hasta que L y S 
vayan a tener, por lo menos, un punto co~ 
mún quedando S, no obstante, en uno de 
los semiplanos determinados por el hiper- 
plano L. Este se denomina hiperplano de 
apoyo para el conjunto convexo S. 

Fig. 3-41. Hiperplano di- i el conjunto convexo S es la envol- 

visor tura del conjunto finito A, entonces aquél 

representa un polígono convexo. En este 

caso el plano de apoyo va a pasar por el vértice, arista o borde 

del polígono (fig. 3-10). En cualquiera de dichas variantes resulta 

que al menos uno de los vértices del poligono está en el hiperplano 
de apoyo. 

Teorema 3-4 (teorema del hiperplano divisor). Si S y T son 
conjuntos convexos no intersecados y, por lo menos, uno de ellos 
está limitado, existe un hiperplano tal que los conjuntos S y T 
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están en los diferentes semiespacios determinados por dicho hiper- 
plano. En otras palabras, existe el hiperplano px =c, donde 
P = (Pi, ..., Pn) es cierto conjunto ordenado de números reales, 
y X= (X, .-.., Xn) es un punto arbitrario, tal que px > c, si 
xeS y px < c, si x&T. La ilustración geométrica de este teore- 
ma se muestra en la figura 3-11. 


PROBLEMAS PARA EL CAPITULO 3 


3-1. En el espacio tridimensional están dados los puntos x = (1,0,2), 
y= (3,4,0), z = (1,2,3). Comprobar para estos puntos el axioma del trián- 
gulo en los espacios CH, Ci”, C%, 

3-2. Dibujar en el plano (x, y) la circunferencia con centro en a y radio r 
en los espacios C$, Cf, CM. 

3-3, Demostrar las fórmulas (3-25) y (3-27) para determinar la media, 

3-4. Determinar el cambio cualitativo de la línea que separa las clases A y 
B en el ejemplo 3:5, si en la clase A hay además un segundo modelo as, Anali- 
zar el caso en que az = (2,1), ae = (2,5) y a2(6,3). 

5 ¿Qué aspeclo va a tener la linea que separa las clases A y B en la 

figura 3-4,b si la distancia se determina: 

a) por la fórmula (3-3), 

b)_ por la fórmula (3-4). 

3-6. Demostrar que la esfera abierta B(0,r) en el espacio En es un con- 
junto convexo. 

37. ¿Cuáles de los conjuntos (0.3) (5,7), (0,31UI5,7] en el espacio de nú- 
meros reales R son convexos y cuáles no lo son 

3-8, Demostrar que el punto x, en la figura 3-8 es la media ponderada de 
los vértices Q1, aa y as 


Capítulo cuarto 
ELEMENTOS DE ALGEBRA LOGICA 


4-1. OPERACIONES LOGICAS 


a) Concepto de proposición 


Como vimos antes pueden presentarse los conjuntos por dos 
métodos: de enumeración y de descripción, o sea, indicando la 
propiedad que poseen los elementos del conjunto, El método des- 
criptivo para presentar los conjuntos vincula la teoría de conjun- 
tos con la teoría de las proposiciones que constituye la primera 
y más sencilla parte de la disciplina científica llamada lógica ma- 
temática. 

Llamaremos proposición a cada afirmación que puede ser ver- 
dadera o falsa. Vamos a examinar las proposiciones con respecto 
a los elementos de cierto conjunto universal /. Los diversos ele- 
mentos de este conjunto van a poseer diferentes propiedades y en 
concordancia con esto pueden formar distintos grupos que consti- 
tuyen subconjuntos del conjunto 7. Así pues, si Z es el conjunto 
de estudiantes en un grupo, sus subconjuntos pueden ser: X, el 
conjunto de estudiantes sobresalientes; Y, el conjunto de estudian- 
tes que viven en la residencia estudiantil; Z, el conjunto de estu- 
diantes becados, etc. 

Después que se hayan distinguido las propiedades que poseen 
los diversos subconjuntos pueden hacerse determinadas afirmacio- 
nes respecto a si uno u otro elemento de / tiene las propiedades 
requeridas. Estas afirmaciones serán proposiciones: “es estudiante 
sobresaliente”, “vive en la residencia de estudiantes” y “es be- 
cario". 

En lo sucesivo nos abstraeremos de todas las propiedades de 
las proposiciones a excepción de una: cada una de las proposicio- 
nes puede ser verdadera o falsa con respecto al elemento conside- 
rado del conjunto universal /. Así bien, la proposición “el estu- 
diante Ivanov es sobresaliente” es cierta si el estudiante Ivanov 
pertenece al subconjunto X, y falsa si no pertenece a éste, 

Por eso el subconjunto X se denomina conjunto de veracidad 
para la proposición “es estudiante sobresaliente”. Los conjuntos 
de veracidad para las proposiciones “vive en la residencia de estu- 
danten" y “es becario” serán, respectivamente, los conjuntos 
YyZ. 
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El conjunto de veracidad de cierta proposición puede resultar 
vacio. En este caso la proposición se denomina idénticamente fal- 
sa. Así, para el grupo estudiantil será idénticamente falsa la pro- 
posición “es mayor de cincuenta años”. Puede suceder que el con- 
junto de veracidad de cierta proposición coincida con el conjunto 
üniversal /. En este caso la proposición se llama idénticamente 
verdadera. Para el grupo estudiantil será idénticamente verdadera 
la proposición “es menor de cincuenta años”. 


b) Proposiciones simples y compuestas 


Vamos a designar las proposiciones con letras minúsculas del 
alfabeto romano y atríbuir a cada una de ellas valores numéricos 
de 1 y O según sea verdadera o falsa la proposición. Supongamos 
por ejemplo que x denota la proposición “es estudiante sobresa- 
iente”. Sus valores numéricos son: 


( 1, si x es verdadera, o sea, x & X; 
x= 


O, si es falsa, o sea, xẹ¢ X. en 

Las proposiciones x, y, z a las cuales corresponden los conjun- 
tos de veracidad sencillos X, Y, Z se denominan proposiciones sen- 
cilias. No obstante, puede resultar un conjunto de veracidad el con- 
junto Q obtenido de los conjuntos X, Y, Z por medio de cualquier 
operación algebraica con dichos conjuntos. En tal caso va a co- 
responder al conjunto de veracidad Q la proposición q Hamada 
proposición compuesta. Por ejemplo, al conjunto de veracidad 
Q = X N Y que posee tanto la propiedad X (estudiante sobresa- 
tiente) como la propiedad Y (vive en la residencia de estudiantes), 
va a corresponder la proposición compuesta “es estudiante sobre- 
saliente y vive en la residencia estudiantil”, 

En el ejemplo dado obtuvimos una proposición compuesta en- 
lazando dos proposiciones mediante la conjunción “y”. Sería po- 
sible obtener una proposición compuesta utilizando otras cópulas: 
“o”, “si, entonces”, etc. De una proposición puede obtenerse una 
nueva negándola. A cada una de estas nuevas proposiciones van 
a corresponder sus conjuntos de veracidad en el conjunto univer- 
saj 1, es decir, las proposiciones compuestas pueden ser también 
verdaderas o falsas, o sea, tomar los valores numéricos 1 y 0. 

Considerando las proposiciones como magnitudes que toman 
valores 1 y 0 pueden determinarse con las mismas las operaciones 

ue permiten obtener de las proposiciones dadas otras nuevas. 
Estas operaciones van a expresar las cópulas citadas más arriba 
que se emplean en el lenguaje corriente. 

Las operaciones realizadas con las proposiciones se denominan 
operaciones lógicas. El total de las operaciones lógicas que se exa- 
minan más adelante recibió el nombre de álgebra de proposiciones 
o álgebra booleana (de Boole). a 
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c) Presentación de las operaciones lógicas 


Supongamos que tenemos varias proposiciones sencillas 


Xi .-., Xy cada una de las cuales puede ser verdadera o falsa, 
o 'sea, adquirir valores numéricos 1 y 0. Podemos considerar el 
total de estas proposiciones como el cortejo (xy, ..., Xw). 

Tabla 4-1 


Funciones de dos variables lógicas 


uN PARR BRE 

ellasi ži al-l eia E R E 
0 ofofojofo[olof1j1[1frprfrprfrjodo 
o ifjofofjijojifififofijifofijojojof: 
EERIE AENEA [+ [1fof1f1iflofof1jfo 
1ajof'fifijifofipififofofolofilo]o 


Supongamos que con estas proposiciones hemos realizado cierta 
operación lógica como resultado de la cual obtuvimos una nueva 
proposición q que puede ser asimismo verdadera o falsa, es decir, 

puede tomar los valores 1 y 0. En este 
Tabla 4-2 caso a cada combinación de valores 
PETI A +, Xy Va a corresponder un valor 


rminado 9 = (1,0). En consecuen- 

cia, la operación lógica puede conside- 

AE rarse como el reflejo f del conjunto de 
los valores del cortejo (xı, .. 


<> Xx) en 
el conjunto de los valores q 
Filis aas Xn) —> (1, 0). 


Si este reflejo es univoco el mismo 
define la función 


q=} (ži .., Xn), (4-2) 


que se denomina función booleana. Co- 
mo se infiere de lo dicho, en las funcio- 
nes booleanas tanto los argumentos, 
como las funciones propiamente dichas sólo pueden tomar dos va- 
lores diferentes que designamos por 1 y 0. 

Se emplean tres métodos para representar las funciones boolea- 
nas: 


1. La fórmula, que indica en forma explicita la secuencia de 
operaciones lógicas que se realizan con las proposiciones Xi, . .., Xy 
y que tiene la forma de relación (4-2). 

2. La tabla, que señala los valores de veracidad de la proposi- 
ción compuesta q según los valores de veracidad de las proposi» 
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ciones iniciales. En la parte izquierda de la tabla se enumeran 
todas las combinaciones posibles de valores de veracidad 
xı, ..., Xx, y en la parte derecha, los valores de veracidad de la 
proposición compuesta q. Si hay Ñ proposiciones iniciales, el nú- 
mero de líneas de la tabla será de 2%. Pueden servir como ejemplos 
de ellas las tablas 4-1 y 4-2. 

3. El esquema lógico que representa la designación gráfica de 
referencia convencional de la operación lógica que tiene el aspecto 
mostrado en la figura 4-1. 


a 
z a i 
i 


Fig. 4-1. Designación convencional de la operación lógica 


En automática y técnica de cálculo se acostumbra a presentar 
las diferentes proposiciones en forma de señales que tienen dos 
niveles, o en forma de dispositivos capaces de ocupar dos posicio- 
nes (relé, trigger, tubo electrónico, transistor, etc.). A estos dos 
niveles de las señales o dos estados del dispositivo se atribuyen 
los valores numéricos 1 y O que determi- 
nan los valores de veracidad de las pro- 
posiciones correspondientes, Con esta 
concepción el esquema lógico va a cons- 
tituir un convertidor de señales que 
puede utilizarse con fines de mando de 
diversos procesos. 

Ejemplo 4-1 Para mantener la temperatura 
O de un termostato en el nivel deseado Op se 
emplea el elemento calentador EC (fig. 4-2) que 
puede funcionar en dos regímenes: “Conectado” 
y “desconectado”, El mando de la conexión del 
elemento calentador se realiza por la regla: Pig 42 Regulación de ta 

desconectar el EC si O > Bo. mo ¿da Uiefnes: 

Tomemos la proposición “temperatura mayor tato 
de Oy como proposición inicial x y la pro- 
osición “conectar el EC”, como proposición compuesta g. Entonces la estruc- 
jura lógica del circuito de mando del elemento calentador va a tener la for- 


ma: 
1, si x= 0; 
IL o, si z= 


En la figura 4-2 se muestra lización fisica de la ley de mando des- 
crita. La señal x se expresa pi ura de la columna de mercurio del ter- 
mómetro 7 que con 8 > @ cierra el contacto del relé R, conectando así el 
elemento calentador, 


n 


4-2. ALGEBRA DE PROPOSICIONES 
a) Negación 


Sea x la proposición cuyo conjunto de veracidad es X. Designe- 
mos por E (se lee “no es x”) una nueva proposición que tiene el 
conjunto de veracidad X y que se denomina negación o inversión 
e X. 
La relación entre x y ž puede determinarse utilizando el dia- 
grama de Euler — Venn dado en la figura 4-3, a. Según la defini- 


ción de negación, F = 1 en la zona X, don- 
dex=0y%=0cn la zona X donde 
7 x= 1. Esto puede escribirse en forma de 
á las siguientes reglas de inversión: 
E Ps 
T=0, 0=1. (4-3) 
En la figura 4-3, b se muestra la repre- 
a) ea sentación de la operación de negación en 
z S forma del esquema lógico denominado in- 
versor. 
ó) 
Fig. 4-3. Diagrama de Eu- b) Adición lógica 
ler — Venn y designación "i H 
convencional de la opera Sean x e y proposiciones que tienen 
ción «de negación conjuntos de veracidad X e Y, respectiva- 


mente. Designemos por x + y (a veces se 
escribe x V y y se lee x o y) la nueva proposición que tiene el 
conjunto de veracidad X U Y y que se denomina suma lógica o 
disyunción de x e y. 


g4z=-0 z zy ¥ TA Zo A. tth 
=0 E 
y 7 La 


S b) o) 


aj 


Fig. 4-4, Diagrama de Euler — Venn y designación convencional de la opera- 
> ción de adición lógica 


Las relaciones entre los valores numéricos x, y y x + y se toman 
del diagrama de Venn en la figura 4-4, a. El conjunto de veracidad 
de la proposición x + y es la zona rayada en correspondencia con 
la cual 
0, six=0e y=0; 


+i=[ 1, en todos los demás casos, (ee) 
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Es cómodo escribir las relaciones (4-4) en forma de reglas que 
recuerdan algo las reglas de la suma aritmética habitual: 


(4-5) 


En la figura 4-4, b se muestra el esquema lógico utilizado para 
representar la operación de adición lógica que se denomina es- 
quema de reunión, 

La regla de adición lógica se extiende fácilmente al caso de tres 
o más proposiciones. En el caso general la suma lógica de n pro- 
posiciones se determina por la regla 


0, six =x= ... X = 0; 
PRAE ene +a={ 1, en todos los demás casos. 
El esquema lógico para este caso se muestra en la figura 4-4, c. 


(4-6) 


c) Multiplicación lógica 


Sean x e y las proposiciones que tienen los conjuntos de veraci- 
dad X e Y, respectivamente, Designemos por xy (a veces se escribe 
x A y y se lee x e y) la nueva proposición que tiene el conjunto de 


Fig. 4-5. Diagrama de Euler — Venn y designación convencional de la opera- 
ción de multiplicación lógica 


veracidad X N Y y se denomina producto lógico o conjunción de 
xey 

El conjunto de veracidad de las proposiciones xy está dado por 
la zona rayada del diagrama de Euler — Venn en la figura 4-5, a 
al examinar la cual obtenemos: 


1, si +=1 e y=l; 
w={ s 


O, en todos los demás pasos. (4-7) 


Esta relación puede representarse en forma de reglas de multi- 
plicación lógica que coinciden con las reglas de multiplicación 
aritmética: 


0-0=0, 0:-1=0, 1-0=0, l-1=1l. (4-8) 
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En la figura 4-5, b se muestra el esquema lógico empleado para 
representar la operación de multiplicación lógica y denominado 
esquema de coincidencia. 

La regla de multiplicación lógica se extiende al caso de tres 
o más proposiciones. Así pues, el producto lógico de n proposi- 
ciones se determina por la regla 


lsix=%=... =x=l; 


Xa n= { (4-9) 


0, en todos los demás casos. 


El esquema lógico para este caso se presenta en la figura 4-5, €, 

Una de las variantes del esquema de multiplicación lógica es la 
operación del producto lógico de una proposición x por la inver: 
de otra 5, la que puede representarse en la forma: 


=] x, si y=0 
MELO, siy=1. 


(4-10) 


Como dicha operación se encuentra con bastante frecuencia, 
para representarla es conveniente emplear el esquema lógico es- 
pecial dado en la figura 4-6, Este esquema lógico tiene el aspecto 


Fig. 4-6. Esquema de inhibición 


del esquema de coincidencia con la diferencia de que la entrada de 
inversión y no termina una flecha sino en un circulito. Como se 
ve en (4-10), la aplicación de una señal y =1 a dicha entrada 
resulta que ella como si cerrara el camino para el paso de la señal 
x a la salida del circuito. Por eso la entrada y se liama entrada de 
inhibición y el esquema de la figura 4-6 recibió el nombre de es- 
quema de inhibición. La operación lógica propiamente dicha corres- 
pondiente a las correlaciones (4-10) se denomina operación de in- 
ibición. 


d) Funciones booleanas 


Algunas proposiciones a las cuales se atribuyen valores numé- 
ricos de veracidad de 1 y O pueden considerarse como unas varia- 
bles binarias. En lo adelante vamos a denominarlas variables lógi- 
cas. Las operaciones de negación, adición y multiplicación lógicas 
constituyen funciones de las variables lógicas; con esto, la opera- 
ción de negación es función de una variable lógica y las opera- 
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ciones de adición y multiplicación lógicas son funciones de dos 
o más variables lógicas. 

Como se ha indicado ya, la particularidad de estas funciones 
consiste en que ellas sólo pueden tomar dos valores 0 y 1. 

Las funciones en las cuales tanto los argumentos como las 
mismas funciones sólo pueden tomar dos valores distintos se de- 
nominan funciones booleanas. Naturalmente, además de las funcio- 
nes consideradas pueden haber otras funciones booleanas. Sin em- 
bargo, puede demostrarse que la cantidad de diversas funciones 
booleanas de un número finito de variables lógicas, es finita. 

En efecto, supongamos que queremos formar todas las funcio- 
nes booleanas posibles de m variables lógicas x, y, z ... Llamare- 
mos juego al total de los valores numéricos de estas variables. Es 
posible obtener por todo 2™ juegos. 

Sea f(x, y, z...) una función booleana. A cada uno de los 
juegos corresponde un valor numérico determinado (1 ó 0) de la 
función booleana, así que ésta puede considerarse como un juego 
de 2m variables. Las distintas funciones booleanas van a diferir 
por los valores de las variables lógicas en este juego. Por cuanto 
cada variable puede tomar solamente dos valores, el número de 
diversas funciones booleanas de m argumentos es: 


B(m)=2”. (4-11) 


Con m = | podemos obtener 2? = 4 funciones booleanas distin- 
tas, a saber: las constantes 1 y O, la propia función x y su nega- 
ción X. 

Con m = 2 hay 2! = 16 funciones booleanas diferentes. En la 
tabla 4-1 se dan los valores de estas funciones y sus designaciones 
convencionales dispuestas de tal modo que la segunda mitad de la 
tabla se obtiene a partir de la primera utilizando Ja operación de 
negación. Además de las funciones examinadas anteriormente, for- 
man parte de la tabla 4-1 las siguientes funciones: 


x O y, adición por el módulo 2; 

x > y, y > x, implicación u operación de secuencia lógica; 
y = x/y, función de Sheffer; 

x E y, función de Peirce (función de Webb); 

1D y = x ~ y, equivalencia lógica; 

> Y y > x, funci ó 


n de inhibición. 


Es importante destacar que todas las funciones booleanas de 
dos variables lógicas examinadas pueden representarse con ayuda 
de tres operaciones lógicas consideradas anteriormente: negación, 
multiplicación lógica y adición lógica. Así pues, mediante la com- 
probación directa en todos los juegos (x, y) es fácil cerciorarse de 
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que se cumplen las siguientes relaciones: 
(a) 1Dy=3y + 95 
(b) x> y= +y; 
(0 y>x=x+ 
(d) xOy =x ~ y = xy +9; 


(e) x—> y =x; 


(4.12) 


(1) y> r= yr. 


El juego de operaciones lógicas se llama juego completo, si el 
mismo permite representar cualquier función de Boole. Además del 
juego ya examinado que consta de las operaciones de negación, 
multiplicación lógica y adición lógica pueden haber también otros 
juegos completos. Asi, puede servir de juego completo una sola 
operación, la función de Sheffer xy designada con frecuencia por 
x/y, de lo que es fácil cerciorarse representando en forma de esta 
operación las tres operaciones del juego completo arriba mencio- 
nadas: 


== xj; 
xy = ïy = xfy = («ly Gl 
x+ y + FD = 3g = (201 /v. 


También es fácil mostrar que la función de Peirce constituye 
asimismo un juego completo. 


e) Leyes e identidades del álgebra de proposiciones 


Vamos a llamar fórmulas booleanas (de Boole) y designar 
A(x, y, 2 ...), B(x, y, z) las expresiones formadas por un número 
finito de variables lógicas x, y, Z ..., por signos de las operaciones 
lógicas de negación, multiplicación lógica y adición lógica y tam- 
bién por las constantes 0 y 1. Para la comprensión univoca de las 
fórmulas booleanas cada nueva operación lógica deberá ir acom- 
pañada por la introducción de un par de paréntesis. Sin embargo, 
para evitar ye las fórmulas sean excesivamente complicadas 
y disminuir el número de paréntesis empleados se introduce por 
analogía con el ålgebra elemental el concepto de prioridad de las 
operaciones: primeramente deben realizarse las operaciones de ne- 
gación, después, de multiplicación lógica y, por último, las opera- 
ciones de adición lógica. 

Cada fórmula booleana puede considerarse como la represen- 
tación de cierta función booleana de las variables x, y, z ..., cuyo 
valor en un juego concreto de variables es fácil de obtener si se 
colocan los valores de las variables en este juego (0 ó 1) en la 
fórmula booleana y se realizan las operaciones lógicas señaladas, 
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Para unas mismas variables lógicas pueden obtenerse distintas 
fórmulas lógicas entre las cuales pueden encontrarse fórmulas ta- 
les como, por ejemplo, A y B que dan los mismos valores de las 


funciones booleanas en todos los juegos iguales de las variables 
lógicas x, y, z ..., es decir, satisfacen la condición 
Alx, y, z...) = B(x, y 2...) (4-13) 


Una de las tareas del álgebra booleana’ es establecer co:.ela- 
ciones idénticas del tipo (4-13). 

Para comprobar si son correctas las relaciones idénticas del ál- 
gebra booleana pueden calcularse sencillamente los valores de las 
funciones en los primero y segundo miembros de la identidad en 
todos los 2" juegos de variables. 

Otro método para establecer la identidad de dos fórmulas boo- 
leanas es determinar sus conjuntos de veracidad. Si para dos fór- 
mulas booleanas los conjuntos de veracidad coinciden, estas fórmu- 
las dan una misma función booleana. 

En el capítulo 1 fue demostrada una serie de identidades del 
algebra de los conjuntos. Cada una de esta identidades deter- 
mina cierta identidad para las fórmulas booleanas. Examinemos, 
por ejemplo, la siguiente identidad del álgebra de los conjuntos: 


(AXNY)UZ=(XUZ)IN(YUZ). 

El primer miembro de esta identidad es el conjunto de veraci- 
dad para la fórmula booleana xy + 2, y el segundo miembro, para 
(x + 2) (y + z). Por cuanto los conjuntos de veracidad coinciden 
ara ambas fórmulas booleanas, estas fórmulas dan una misma 
unción booleana, es decir, se cumple la identidad 

xy +2=(x +2) (y +2). 


Esta identidad es notable por el hecho de que no tiene analogía 
en el álgebra ordinaria sobre lo que se hizo énfasis en el capítulo 1. 

Proponemos al lector cerciorarse por sí mismo de que se cum- 
plen las leyes e identidades de la lógica matemática que siguen 
más abajo, confrontándolas con las identidades correspondientes 
del álgebra de los conjuntos o comprobando los valores de veraci- 
dad en los primero y segundo miembros eri todos los juegos de 
variables lógicas. 


Leyes del álgebra booleana 
a) x+y=y +x } 
b) xy = yx; 
c) (+y) + z=x + (y +2); 
d) (xy) z = x (yz): 
è) (x +y) z= x2 + yz; 
R i) xy z=% +2) +2). 


ley conmutativa; 
} ley asociativa; 


} ley distributiva. 
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Identidades del álgebra booleana 


a) xi=0; g) x=x 
bx+i=1 h) x4 xr= x; 
c) x- =x; Di=x 
di+i=1; Dx+y=35% 


k) w= +ý. 


4-3. SINTESIS DE LOS ESQUEMAS COMBINATORIOS 


a) Concepto de esquema combinatorio 


Vamos a entender por esquema combinalorio un dispositivo 
técnico oe sirve para convertir la información discreta (disconti- 
nua) y tiene n circuitos de entrada y m circuitos de salida. Las 
señales suministradas a los circuitos de entrada y tomadas de los 
circuitos de salida sólo pueden tener los valores 1 y O. Estas se- 
ñales pueden ser, por ejemplo, los niveles alto y bajo de la tensión. 


r Ty 
y 
z 
Fig. 4-7. Ejemplo de esquema lógico combinatorio 


De esta manera, el esquema combinatorio convierte cierta palabra 
de entrada de n letras del alfabeto binario en una palabra de sa- 
lida de m letras del mismo alfabeto. Al hacerlo se supone que la 
palabra de salida se recibe en la salida en el mismo momento en 
que se suministra a la entrada la palabra de entrada, es decir, en 
el esquema combinatorio no hay retardo de señales. 
Frecuentemente se utilizan en calidad de elementos, con los 
cuales se construye el esquema combinatorio, esquemas lógicos 
elementales para las operaciones de negación, multiplicación lógica 
y adición lógica. En tal caso puede obtenerse el esquema combi- 
natorio conectando en serie los circuitos de salida de unos es- 
quemas lógicos elementales a los circuitos de entrada de otros 
esquemas lógicos elementales y evitando conectar a un mismo cir- 
cuito de entrada varios circuitos de salida. Si el esquema combina- 
torio tiene un conjunto finito de señales de entrada x, y, 2... y una 
salida única q, entonces el proceso descrito de conexión en serie de 
los esquemas lógicos elementales corresponde al proceso de forma- 
ción de la fórmula lógica f(x, y, z ...) con ayuda de las operacio- 
nes realizadas con los esquemas lógicos elementales que se utill- 


zan. Así pues, a la fórmula lógica del tipo 
q=iy+2 (4-14) 


va a corresponder el esquema combinatorio dado en la figura 4-7 
y en la tabla 4-2. En diversos casos es conveniente armar un es- 


2 Circuito cerrado / 
a Circuito abierto 0 


s—oPo—= Contacto de cierre z 


oo da Conexión en serte zy 


z 
Conexión en paralelo 
E) Tey’ 


Fig. 4-8. Representación de las operaciones lógicas elementales con ayuda de 
contactos 


z $ 
Si oo 7 
A 
Fig. 49. Esquema de conmutación para la operación žy + 2 
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o 
L 


z z r 2er 
PO oo 0 


z 

1 _ zta 

a Ez) ME E aa 
Z 


LYtZe(LAZN(Y+Z) 


ALS 
Fig. 4-10, Conversiones idénticas de los circuitos de conmutación 


juema combinatorio con los elementos que realizan la función de 
heffer o la de Peirce. 

Sirven como uno de los métodos de realización material de los 
esquemas combinatorios los cas de relé de contactos que per- 
miten efectuar las operaciones lógicas mediante el cierre da aper- 
tura de los contactos de varios circuitos. Designemos por l el cir- 
cuito cerrado y por 0 el circuito abierto. Para gobernar el estado 
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del circuito introducimos en él los contactos cuyo estado se deter- 
mina por el valor de las variables de entrada x, y, z ... Es fácil 
convencerse de que a las operaciones de multiplicación y adición 
lógicas van a corresponder las conexiones en serie y en paralelo 
de los contactos, como se muestra en la figura 4-8. 

Por medio de distintas conexiones de los contactos es posible 
crear esquemas que ejecuten operaciones lógicas. En la figura 4-9 
se muestra un esquema de relé de contactos que realiza la opera- 
ción (4-14), y en la figura 4-10 se presentan los esquemas de relé 
de contactos que ilustran algunas identidades de lógica matemá- 
tica. 

En los últimos años han alcanzado difusión los métodos de 
elaborar los esquemas combinatorios sin contactos que se confec- 
cionan con ayuda de elementos semiconductores y magnéticos 
reunidos en esquemas integrales. 


b) Composición de una fórmula lógica según 
una tabla dada 


Al proyectar esquemas combinatorios rara vez se logra expresar 
directamente a modo de fórmula lógica los problemas a resolver 
con tal esquema. Por lo general, en la primera etapa se utiliza la 
descripción verbal de las tareas a solucionar con el esquema, y 
fundándose en ésta se consigue compilar la tabla que relaciona 
los valores numéricos de las variables lógicas de entrada y de sa- 
lida. El paso de la tabla a la fórmula lógica es la segunda etapa 
de la sintesis del esquema combinatorio. 

Vamos a denominar la tabla la más sencilla, si ésta correspon- 
de a las operaciones de multiplicación o adición lógicas de las 
proposiciol iniciales. Si la tabla corresponde a la operación de 
multiplicación lógica, van a haber ceros en todas las líneas de la 
columna q y sólo estará la unidad en una sola línea correspon- 
diente a las proposiciones iniciales verdaderas. Si la tabla corres- 
ponde a la operación de adición lógica, en todas las líneas de la 
columna q van a haber unidades y el cero sólo estará en la línea 
correspondiente a las proposiciones iniciales falsas. 

Aclararemos con los ejemplos de las tablas 4-3 y 4-4 el modo de 
obtener la fórmula lógica para la tabla más sencilla, 

En la tabla 4-3 el cero sólo está en la segunda línea de la co- 
lumna q, lo que corresponde a la operación de adición lógica. Como 
que en esta línea z = 0 e y = 0, entonces q =X + y. 

En la tabla 4-4 la unidad sólo está en la segunda línea de la 
columna q, to que corresponde a la operación de multiplicación 
lógica. Como que en dicha linea x = 1 e ĝ = t, entonces q = x/. 

Si la tabla no es la más sencilla, puede escribirse para ella la 
fórmula lógica por cualquiera de dos métodos típicos. 

Primer método. En la columna q reemplacemos por ceros todas 
las unidades, una tras otra salvo una, compilemos las fórmulas 


120 


lógicas correspondientes a cada una de las tablas más sencillas 
que se obtienen así y tomemos su suma lógica. 


Tabla 4-3 Tabla 4-4 
q=:+y q4=xi 

y 4 =u a 

0.0 1 0.0 o 

10 o 10 1 

01 1 0.1 o 

1-1 1 11 o 


Segundo método. En la columna q reemplacemos por unidades 
todos los ceros, uno tras otro salvo uno, compilemos las fórmulas 
lógicas correspondientes a cada una de las tablas más sencillas 
que se obtienen así y tomemos su pro- 

sueo lógico. q Hei i Tabla 4-5 

ustremos estos métodos con el n 2 

ejemplo de obtener la fórmula lógica -nacn Dor et médulo 
para la tabla 4-5. Examinemos separa- 
damente por el primer método las tablas "2 

que contienen la unidad sólo en la se ———— 
gunda y la tercera lineas de la colum- 


o o o 
na q. A ellas corresponden las fórmulas 0.1 1 
lógicas Ey y xī. Tomando la suma lógi- ro 1 
ca de estas fórmulas, obtenemos: na o 


q= žy + x9. 

Examinemos separadamente por el segundo método las tablas 
que contienen el cero sólo en la primera y la última líneas de ta 
columna q. A ellas corresponden las fórmulas lógicas x+- y y 
3 + J. Tomando el producto lógico de estas fórmulas, obtenemos: 

q=(+y(+9). 

Como vemos, los métodos primero y segundo dan diferentes 
fórmulas booleanas para una misma tabla. No obstante, empleando 
las identidades de lógica matemática no es difícil reducir la se- 


gunda fórmula a la primera. Abriendo paréntesis y tomando en 
cuenta que x = 0 e y] = 0, se obtiene: 


q=xž + xý + y? YO =x + yi. 
El método analizado es universal en el sentido de que permite 
obtener la fórmula lógica y, en correspondencia con ella, construir 


el esquema combinatorio para cualquier tabla. Sin embargo, este 
método, por lo general, conduce a fórmulas complejas y para reali- 
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zarlas se requiere gran número de elementos diversos. Por cierto, 
vamos a entender por complejidad de una fórmula el número de 
operaciones que constituyen esta fórmula, de manera que la com- 
piejidad de la fórmula será el número | y la complejidad de la 
órmula (3 + y)(9 +z) será el número 5 (dos negaciones, dos 
adiciones, una multiplicación). A modo de ejemplo compilemos por 
el primer método la fórmula lógica para la tabla 4-2: 


q= žyž + łğz + x02 + Xyz + xyz. (4-15) 
Esta fórmula es mucho más compleja que (4-14), aunque ambas 
corresponden a una misma tabla. De este modo, una importante 


tarea de síntesis de los esquemas combinatorios es la de simpli- 
ficar o minimizar las fórmulas booleanas. 


c) Simplificación de las fórmulas booleanas 


Para simplificar las fórmulas booleanas se utilizan las identi- 
dades de lógica matemática examinadas en el párrafo anterior. Es 
cierto, que el uso con éxito de estas identidades depende de la 
práctica y la habilidad al manejarlas, lo que se logra después de 
adquirir cierta experiencia en dichas transformaciones. No obstan- 
te, existen ciertos métodos típicos que en la mayoría de los casos 
permiten simplificar felizmente fórmula complicada. 

La simplificación de una fórmula booleana debe comenzarse 
hallando una de las formas siguientes: AB+AB, A+AB, 
A+AB, donde A y B denotan las propias variables lógicas o los 
productos lógicos de unas cuantas variables. Cada una de las ex- 
presiones obtenidas puede escribirse de manera más simple 


AB + AB = A (B + B)= A; (4-16) 
A+AB=A(l + B)= A i (4-17) 
A+ AB=(A+ AB) + AB= A + B. (4-18) 


Volvamos a la fórmula (4-15) y tratemos de simplificarla utili- 
zando las identidades examinadas. Aerupando los sumandos pri- 
mero y cuarto, así como el tercero y quinto, y aplicando las identi- 
dades (4-16) obtenemos: 

q= žy +X52 + xz. 
La simplificación ulterior no presenta dificultades 
q= 3 (y + gz) +xz= ŝ ly +z) + x2= žy + žz + xz = iy +2 


Al simplificar Jas fórmulas lógicas, siempre hay que tomar en 
consideración la identidad A + A = A, de la cual se deduce que 
cada uno de los sumandos puede utilizarse repetidamente en com- 
binaciones con otros sumandos. Teniendo en cuenta esta circuns- 
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tancia, examinemos la simplificación de la siguiente fórmula ló- 
gica: 
q = x} + xy2 + ¡yz + xyz. 


Aplicando la identidad (4-16) a los sumandos segundo y cuarto, 
así como al tercero y cuarto, obtenemos 


q= x93 + xy + yz =x (y + 92) + yz = x (y + Z) + yz 
= xy +x2 + yz. 


No se logra su simplificación ulterior con ayuda de las identi- 
dades examinadas mås arriba. Surge la cuestión: ¿es acaso la 
forma dada la mås sencilla? Esto puede verificarse probando si la 
misma contiene o no sumandos sobrantes. Al hacerlo vamos a de- 
nominar sobrante el sumando si en cualquiera de los juegos de 
variables en el que aquél se convierte en la unidad, también se 
vuelve igual a la unidad cualquier otro grupo de sumandos. Así 
pues, el sumando xy se convierte en la unidad en el juego x = l, 
y = 1. En tal caso la suma de los otros dos sumandos da xž + 
+ yz =2+2= 1. De este modo, el sumando xy es sobrante y 
puede eliminarse de la fórmula, de lo que en definitiva se obtiene 


q=x2+ yz. 


Por el método de selección completa se halla la más sencilla 
de todas las formas que no contienen sumandos sobrantes. Pueden 
haber varias de estas formas. 

Para aquellos casos en que el número de variables de entrada 
no es mayor de cuatro, la búsqueda de los tipos más sencillos de 
fórmulas booleanas se realiza cómodamente utilizando las tablas 
especiales conocidas como mapas de Karnaugh o diagramas de 
Veitch. La tabla 4-6 representa la carta de Karnaugh para una 
función booleana de tres variables. 


Tabla 4-5 Tabla 4-7 


Aspecto del mapa Aspecto del mapa 
de Karnaugh par de Karnaugh para la 
función booleana d función booleana 


varii presentada en la tabla 4-2 
z z 
zv z 
TE o i 

o o 1 2 

0 1 3 4 So 

de 1 5 6 23 

10 7 8 D. 
10 
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Cada cuadrado de dicha carta (ellos están enumerados para facili- 
tar la explicación), corresponde a un juego de variables x, y, z. Es 
cómodo designar los cuadrados correspondientes a los juegos en 
los que la función booleana adquiere el valor 1, con crucesitas 
como se muestra en la tabla 4-7 que representa el mapa de Kar- 
naugh para la función booleana dada en la tabla 4-2, La carta 
está formada de tal modo que tas zonas correspondientes a los 
distintos grupos de cuadrados vecinos pueden considerarse como 
conjuntos de veracidad para las proposiciones correspondientes a 
las fórmulas booleanas más sencillas con una y dos variables’ (en- 
tonces debe estimarse que los bordes superior e inferior de la carta 
están pegados uno al otro de manera que los cuadrados superior 
e inferior de la misma son vecinos). Así pues, corresponden a las 
zonas de cuatro cuadrados vecinos las fórmulas booleanas de una 
varlable: 

1234 — 2; 5678 — x; 3456 — 1278 — j; 1357 — Z; 2468 — 2, 

Corresponden a las zonas de dos cuadrados vecinos funciones 
booleanas de dos variables del tipo 12 — ž7, 56 — xy; 68 — xz, etc. 

Para hallar la fórmula booleana determinada por cualquier con- 
figuración de las celdas en el mapa de Karnaugh es suficiente pre» 
sentar esta combinación en forma de reunión de las zonas indica- 
das anteriormente. La más sencilla de las representaciones de este 
tipo proporciona asimismo la más sencilla fórmula booleana. De 
este modo, para la tabla 4-7 la zona mencionada puede represen- 
tarse como la reunión de la trana vertical 2468, o sea, z con la 
franja horizontal 34, es decir, žy, lo que da q = 2 + žy. 

Para simplificar las fórmulas booleanas con un gran número 
de variables, se vuelve dificultoso el empleo del método descrito. 
En estos casos resulta útil emplear métodos especiales de minimi- 
zación entre los cuales es muy efectivo el método de Quine — 
Mc.Closkey. 


d) Ejemplos de síntesis de esquemas combinatorios 


Ejemplo 4-2. Construir el esquema lógico del sumador de digito con dos 
entradas (semisumado 


El sumador de un ígito realiza la adición de dos números de un dígito se- 


gún la regla 
04+0=0, 04 1=140=1, 1+1=10 


En el último caso se pone 0 en el dígito dado y se transfiere la unidad al 
dígito siguiente, Designemos por x e y los valores del digito dado de los su- 
mandos, q, el valor del dígito dado de la suma, u, p, la unidad de traspaso 
al dígito siguiente. Entonces el funcionamiento del 'semisumador será descrito 
mediante la tabla 4-8 en conformidad con la cual hallamos: 


q= xù + yi p= xy. (4-19) 

El esquema lógico del semisumador se muestra en la figura 4-11. 
Ejemplo 4-3. Esquema selectivo (descifrador). El esquema lógico que tiene 
dos entradas x, y y cuatro salidas qi, qz, 93. qi, se denomina esquema selectivo 
si la señal 1 aparece solamente en una de las salidas para cada una de las 
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Tabla 4-8 Tabla 4-9 


Semisumador Descitrador 
0.0 0 a 00 CETE G 
0.1 1 0 ot 0 I ojo 
ro 1 0 10 ojo t 0 
Tai 0 1 LN ojojoj: 


cuatro combinaciones posibles de las señales de entrada. Salisface a esta con- 
dición la tabla 4-9, según la cual las señoles de salida del esquema deben ser 
iguales a: 


EN E it E Do (4-20) 
En la figura 4-12 se muestra la estructura lógica del esquema selectivo. 


z 


y [A 


Fig. 4.11. Semisumador Fig. 4-12. Descifrador 


Ejemplo 4-4 Operador automático. Presentemos en forma muy simpli- 
ficada el problema de construir el operador automático que gobierna el aterrizaje 
de aviones en un aeródromo. Consideremos que el aeródromo tiene una pista 
de aterrizaje. El avión, al aproximarse en vuelo, emite sus señales de llamada 
y el operador automático da el permiso para aterrizar, Si se aproximaron 
al aeródromo varios aviones, se da la señal de aterrizar a unos y la de mante- 
nerse en el aire a los demás. 

Asignemos a todos los aviones que tienen su base en el aeródromo los 
números del 1 al n. Si varios aviones llegaron simultáneamente, se da prefe- 
rencia en el aterrizaje ol avión con el número de orden menor. Se considera im- 
posible y se excluye del análisis el caso en que se aproximan al aeródromo más 
de tres aviones, Es necesario construir el esquema combinatorio que ejecute las 
funciones del operador automático, 

Formulemos el problema en términos de lógica matemática. Designemos por 
xa la señal de llegada del k-ésimo avión, El esquema lógico combinatorio debe 
transmitir al 4-ésimo avión una de las tres señales siguientes: 


qip aterrizar inmediatamente; 
qa dar una vuelta sobre el aeródromo: 
q» dar dos vueltas sobre el aeródromo. 


En el caso dado es embarazoso describir el funcionamiento del esquema 
combinatorio con ayuda de una tabla y por eso vamos a resolver el problema 
de otra mancra. Notemos que las señales 4%, 94 gg sólo pueden ser iguales a 
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la unidad si el A-ésimo avión se aproxima en vuelo al aeródromo, es decir, sł 
xa = 1. Por tanto, la señal xa debe entrar como factor en las fórmulas lógicas 


para gh. dí» qg que de esta manera pueden representarse en la forma 
DA h= Arm Di A (121) 
Las fórmulas lógicas para Az, A% y A% se obtienen pasando de k a k +1. 


La condición Af, = 1 se cumple si no hay ninguna señal del total xs, . 


m., Xa, es decir, si no hay señal alguna del total xi, .... Xa-s y no hay la 
señal xa. De este modo 


Aga A (4-22) 
La condición Af y, = lse cumple si hay una señal del total Xi, ,... xar 
o sea, si hay uno señal del total xy, ..., ¥a-ı y no hay la señal xa, o no hay 


A 


Fig. 4-13, Despachador automático 


ninguna señal del total xi ..., xa 


y hay la señal xa. De esta suerte. 
Akri ™ Akta + Akta = Akte + de (4-23) 


La condición A% = 1 se cumple si hay dos señales del total Xiw.., xk 


es decir, si hay dos señales del total xı .... Xa—ı y no hay xa o si hay una 
señal de dicho total xı, ..., Xas y hay ta. De este modo, 


Arpi = ARE AA AGA H Gie (4-24) 


Las fórmulas de (4-21) a (4-24) describen por completo la estructura lógica 
de un elemento del esquema combinatorio que gobierna el aterrizaje del f-ésimo 
avión y cuyo esquema se muestra en la figura 4-13. Construyendo dichos esque- 
mas para cada elemento y concctándolos entre si, obtenemos el esquema com- 
pleto del operador automático. 


4-4. CONCEPTO DE DISPOSITIVOS AUTOMATICOS 
TERMINALES 


a) Esquema combinatorio como dispositivo automático 
terminal sin memoria 


El término “dispositivo automático terminal" se utiliza para 
designar una clase de sistemas dinámicos numéricos que se em- 
plean en automática, telemecánica y técnica de cálculo. 


126 


El tipo más sencillo de dispositivo automático terminal son los 
esquemas combinatorios ya examinados a los que, no obstante, es 
conveniente dar una descripción más genera!. 

Supongamos que tenemos unas cuantas variables lógicas 
un, » >», Uy el total de las cuales puede considerarse como la magni- 
tud multidimensional « =(u;, .... £). Sea f una función lógica 
de estas variables, que constituye cierta proposición lógica com- 
pleja 

q=f (tu ..., u). (4-25) 

La variable lógica g puede considerarse como magnitud de sa- 
lida del esquema combinatorio que realiza la operación lógica f con 
las variables ti, ..., Up 

Los esquemas combinatorios que encontramos en la práctica no 
disponen comúnmente de una salida q sino de varias, por ejemplo, 
41 --:> Gm cada salida realiza su función lógica dependiendo de 
las mismas variables lógicas 

CI 
PERA ARA (4-26) 


ACA 


Um 


La estructura de dicho esquema combina- 
torio se presenta en la figura 4-14. 

La relación (4-26) puede escribirse más 
compactamente si se incluyen en el análisis 
la variable lógica multidimensional de sa- 
lida q = (qn .... qm) y la función lógica 
multidimensional f = (fi, ..., fm). Entonces, 
la totalidad de las funciones (4-26) puede 


escribirse a modo de función multidimen- 

r Fig. 4-14. Dispositiv 

sional automático > terminal 
q=} (u). (4-27) sin memoria 


En lo sucesivo vamos a suponer que el esquema combinatorio 
efectúa instantáneamente la operación lógica, es decir, si en deter- 
minado instante ha llegado al esquema cierto valor de la magnitud 
de entrada u Œ U, el valor correspondiente q = f (u) se obtiene a 
la salida en ese mismo instante. 

Para describir el funcionamiento del esquema combinatorio en 
el tiempo conviene introducir el concepto de tiempo discreto. En el 
eje del tiempo marcamos los instantes en los cuales puede sufrir 
cambios la magnitud de entrada, designándolos por to, ti, fa... En 
lo sucesivo será conveniente designar los instantes marcados, sim- 
piemente en forma de números enteros no negativos 0, 1, 2... y 
llamarlos tiempos. La escala así obtenida se presenta en la fi- 
gura 4-15 y será la escala del tiempo discreto. 

Designemos por la letra n el tiempo corriente, es decir, el 
tiempo correspondiente al momento actual. Vamos a designar por 
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ala] y qin] los valores de las magnitudes de entrada y salida en el 
instante actual. Los valores que han obtenido las magnitudes de 
entrada y salida k tiempos antes dei momento actua! van a desig- 
narse por [n — £] y q[(1—£)]. La ecuación que describe el fun- 
cionamiento del esquema combinatorio en el tiempo puede escri- 
birse ahora en la forma 


qla] =f (u In]). (4-28) 


Los esquemas combinatorios son la forma mås sencilla de los 
dispositivos automáticos terminales denominados dispositivos auto- 
máticos terminales sin memoria. Esta denominación pone de mani- 
fiesto que la magnitud de salida del esquema combinatorio en cada 


BEN E nt 
AA 
fo t ta tn 


Fig. 4-15, Escala de tiempo discreto 


tiempo sólo depende de las señales de entrada en dicho tiempo y 
no del estado del esquema ni de las señales de entrada en los 
tiempos precedentes. 


b) Dispositivos automáticos terminales 
de tipo general 


Los dispositivos automáticos terminales sin memoria son el tpo 
más sencillo de dispositivos automáticos, siendo relativamente li- 
mitada la posibilidad de utilizarlos en calidad de elementos de dis- 
positivos calculadores y sistemas automáticos. Se logra una con- 
siderable ampliación de las posibilidades de los dispositivos auto- 
máticos, introduciendo en su constitución elementos adicionales 


atm [Pze 


8. Elemento de memoria 


que retienen durante un lapso de tiempo las señales que llegan a 
su entrada y que reciben el nombre de elementos de memoria, En 
la figura 4-16 se ofrece la representación esquemática de un ele- 
mento de memoria. La reunión de elementos de memoria con es- 
quemas combinatorios permite crear dispositivos automáticos ter- 
minales de tipo general. 

Para el dispositivo automático terminal es característico que su 
estado va a determinarse no sólo por el tipo de señales de entrada 
en el tiempo considerado, sino también por el estado en el que se 
hallaba en el tiempo anterior, siendo necesario por lo general di- 
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ferenciar entre si el estado del dispositivo automático y su señal 
de salida. 

Puede servir de ejemplo de dispositivo automático terminal con 
memoria el esquema representado en la figura 4-17. Este consta de 
tres esquemas combinatorios que realizan las funciones lógicas f 
ha y fs y de dos elementos de memoria. La particularidad de dicho 
esquema consiste en que las se- 
fieles xı y Xa siendo señales de sa- 
lida de dos esquemas combinato- 
rios, llegan a la entrada de aque- 
llos mismos esquemas con retardo 
en un tiempo. Estas señales cir- 
culan dentro del esquema del dis- 
positivo automático terminal y 
pueden denominarse variables que 
describen el estado del disposi- 
tivo automático. La señal de salida 
q constituye cierta función de las 
variables del estado, 

Describamos el funcionamiento 
en el n-esimo tiempo del esquema Fig. 4.17. Dispositivo automático 
examinado. Para simplificar la no- terminal con memoria 
tación no vamos a señalar el nú- 
mero del tiempo n. Marcaremos con una raya los valores de las 
variables del estado en la entrada del elemento de memoria en el 
tiempo considerado. Para las señales xi, x, y q obtendremos 
Jas ecuaciones 


X =h (Fo %o Up 1); 
4h to lo 1); (4-29) 
f(x, 2) =0(%p o lp 1). 


Para simplificar la notación introduzcamos en el análisis las 
magnitudes multidimensionales u = (u, u2), x= (Xn, x2) y la fun- 
ción multidimensional f = (fı, fa). Entonces las ecuaciones (4-29) 
se escriben en la forma 


x =fix, u); q=0(% u). (4-30) 


La función f(x, u) que define un nuevo estado interior del dis- 
positivo automático terminal se denomina función de transiciones, 
y la función p(x, u) que determina un nuevo valor de la señal de 
Salidá se llama función de salidas. 

Si se designan por U el conjunto de señales de entrada, Q, el 
de señales de salida y X, el de estados, puede darse la siguiente 
definición formal de dispositivo automático terminal. Se denomina 
dispositivo automático terminal al total de las cinco magnitudes 


A=({U, Q, X, fm, (4-31) 
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donde f : X X U >X es la función de tránsiciones y y: X X U >Q 
la función de salidas. 

No se acostumbra a presentar los dispositivos automáticos ter- 
minales por medio de ecuaciones (4-30), sino mediante dos tablas 


Tabla 4-10 Tabla 4-11 
Tabla de transiciones Tabla de salidas del 
del dispositivo automático dispositivo automático 
terminal terminal 
x x 
“u a He 
i | 2l3 i| a 
a 213 | 3 a e ela 
b 3| 21 2 b ajeje 


denominadas, respectivamente, tabla de transiciones y tabla de sa- 
lidas. Las lineas de ambas tablas corresponden a diferentes señales 
de entrada del dispositivo automático terminal y las columnas, 
a sus diferentes estados, En la intersección 
de líneas y columnas en la tabla de transi- 
ciones están los valores de la función 
f(x, u) y en la tabla de salidas, los valo- 
res de la función p(x, u). Las tablas 4-10 y 
+ 4-11 pueden servir de ejemplo de presenta- 
ción de un dispositivo automático qué 
tiene dos señales de entrada posibles a 
y b, dos señales de salida posibles c y d, 
y tres estados posibles 1, 2, 3. 
> Otro método de preasignación de los 
dispositivos automáticos terminales que 
Fig. 4-18, Grafo de tran- sp i A 
aaa Gode dan brinda una gran claridad es la preasigna- 
automático terminal ción de los dispositivos automáticos con 
ayuda de grafos direccionales. Los vértices 
del grafo representados en forma de círculos se identifican con 
los diversos estados del dispositivo automático. Los dos vérti- 
ces x; y Xa se conectan por el arco que va de x; a x, en el caso en 
que exista la señal u que hace pasar el dispositivo del estado xi 
al xx. Junto a cada arco se pone la señal u que realiza la transi- 
ción dada y, por lo común, entre paréntesis, la señal de salida q 
obtenida de este modo. En la figura 4-18 se muestra el grafo corres- 
pondiente a las tablas 4-10 y 4-11.” 

Los dispositivos automáticos terminales son el modelo matemá- 
tico de una amplia categoría de sistemas dinámicos que funcionan 
en el tiempo discreto y entre los cuales se encuentran también cier- 
tos tipos de sistemas dinámicos paso a paso múltiples que se estu- 
dian en la segunda parte del libro. En la presente obra no es 
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posible detenerse detalladamente en la teoria de los dispositivos 
automáticos terminales. Por eso nos limitaremos solamente al aná: 
lisis de algunos ejemplos. 

Ejemplo 4-5. Generador de unidades En la figura 4-19, a se muestra el grafo 
de un dispositivo automático terminal que en cada tiempo va a suministrar la 
señal 1 idependientemente de la señal en la entrada, después de que a su 


z 


Mz 


oto) nn ain į 
e CO OD) 10 
2) A b) 


E 
Fig. 4-19. Grafo de transiciones y estructura del generador de unidades 


entrada llega una vez la señal 1. La función de transiciones x’ = I(x, u) 
y la función de salidas q =p(x,u) de este dispositivo se muestran en la 
tabla 4-12 por la que hallamos: 


ETETE TA (4-32) 
La estructura del dispositivo automático se muestra en la figura 4-19.5 


donde está prevista la existencia de la entrada auxiliar r, al suministrarle una 
señal puede suspenderse la generación de unid: 


00) Ko) 0(0) 


Fig. 4-20. Grafo de transiciones y estructura del generador binario 


Ejemplo 4-6. Contador. En la figura 4:20,a está representado el grafo de 
un dispositivo automático terminal que da una unidad en la salida después de 
cada par de unidades en la entrada que se alternan con cualquier número de 


Tabla 4-12 Tabla 4-13 
Generador de unidades Contador binario 


o 
1 
0 
1 


a 


ža 


E 


vape 
e 
iS 


o 
o 
1 
1 


-0-0 
o-=-o 
=o00o 
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ceros, Semejante dispositivo se denomina contador de 2. La función de transi- 
ciones y la función de salidas de este dispositivo automático se presentan en la 
tabla 4-13 por la que hallamos: 


x= + ie q=ax . (4-33) 


La estructura del contador de 2 se muestra en la figura 4-20,b donde está 
prevista la existencia de la entrada auxiliar r suminislrando una señal a la 
cual puede cesar el funcionamiento del contador y pasarlo al estado inicial 0. 


Fig. 4-21. Contador binario y contador de 2% 


La representación convencional del contador de 2 se muestra en la figúra 4-21, a. 
En la fagura 4-21, b se presenta el esquema de n contadores de 2 conectados en 
serie y formando un contador de 2”. 


Fig. 422 Modelo del proceso de enseñanza 


Ejemplo 4-7. Modelo del proceso de enseñanza. Basándose en el contador 
de 2” puede construirse un dispositivo que simula, aunque de forma muy sim- 
pucca el proceso de enseñanza. El esquema de tal dispositivo se muestra en 
la figura 4-22. El mismo tiene dos entradas a y b y se enseña a que después de 


Fig. 4-23. Modelo perfeccionado del proceso de enseñanza 


la unidad en la salida a va a seguir la unidad en la salida b. Si esto sucede 27 
veces (no necesariamente de forma sucesiva y posiblemente con muchas altera- 
ciones), el dispositivo aprende a'prever la unidad en la salida b a continuación 
de la llegada de la unidad a lai entrada a y lo expresa presentando la unidad 
en la salida q cada vez que aparece la unidad en la entrada a. 
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El esquema en la figura 4-22 simula un proceso de enseñanza muy primi- 
tivo, Valiéndonos de ciertos ingenios el dispositivo puede perfeccionarse de tal 
modo que solamente aprenda a saber que “detras de a sigue b”, en caso de que 
este suceso haya ocurrido 2" veces seguidas sin alteraciones y que sea capaz de 
“olvidarlo” si aparecen 27 sucesos “detrás de a no sigue b”, en caso de que 
esta sucesión no se interrumpa por un suceso “detrás de a sigue 6”. El esquema 
de tal dispositivo se presenta en la figura 4-23. 


PROBLEMAS PARA EL CAPITULO 4. 


4-1. ¿Con qué operación lógica puede describirse el funcionamiento del 
esquema de mando en el ejemplo 4-1? 

4-2. ¿En qué consiste la diferencia entre una fórmula booleana y una fun- 
clón booleana? 

4-3. Comprobar con ayuda de los esquemas de conmutación si se cumplen 
las identidades x +Z = 1, x-1 = ], x Ò = 0, xx = x. 

4.4. Componer el circuito de conexiones del alumbrado para un local que 
tiene dos puertas en los extremos opuestos de modo que pueda encenderse la 
luz al entrar por cualquier puerta, y apagarla al salir por cualquiera de ellas. 

4-5. Simplificar las siguentes fórmulas booleanas: 


x92 + xDz + xyžv; 
äyž + xJž + xyž; 
xy +24 (xy +2) (20 x). 


4-6. Construir el esquema lógico del sumador binario de un dígito con tres 
entradas designando por x e y los valores de los dígitos de los sumandos; 
2; la unidad de pase del digito precedente de la suma; p, la unidad de pase 
al dígito siguiente y q, el valor del digito dado de la su 
> 4-7. Construir el esquema lógico del sumador binario de un dígito con 
tres entradas utilizando sumadores binarios con dos entradas, 

4-8, Construir el esquema lógico del sumador binario de digitos múltiples 
utilizando los resultados de los problemas 4-6 y 4-7. 


Capítulo quinto 


CORRELACIONES DE LA TEORIA 
DE LOS CONJUNTOS EN LA TEORIA 
DE PROBABILIDADES Y ELEMENTOS 

DE ESTADISTICA MATEMATICA 


5-1. CONCEPTO DE PROBABILIDAD 


a) Suceso y espacio de resultados de experimento 


La base de la teoría de probabilidades es el concepto de suceso 
aleatorio, Relacionamos este suceso con la realización de cierto ex- 
perimento. 

Al realizar dicho experimento nos interesan sus consecuencias, 
o, como se dice en la teoría de probabilidades, su resultado. Vamos 
a suponer que con el total de condiciones dado las consecuencias 
del experimento pueden ser un número finito de resultados zı, ... 
++ “1 Zm Cuyo total designaremos por 


Z= {zn ..., Za). (5-1) 


Es evidente que a consecuencia de cada experimento tiene lu- 
gar sin falta algún resultado z E Z y no puede haber experimento 
a consecuencia del cual haya dos o más resultados. Vamos a de- 
nominar al cenjunto Z espacio de resultados del peineta y los 
elementos z € Z, sucesos elementales en el espacio Z. 

Sin embargo en la práctica presentan el máximo interés no los 
propios sucesos elementales sino cierto grupo de ellos que son sub- 
conjuntos del conjunto Z. Vamos a llamar suceso en el espacio de 
resultados del experimento Z a cualquier subconjunto S del con- 
junto Z: 

sz. (5-2) 


Cuando decimos que occurre o se realiza el suceso S, sobreen- 
tendemos que el suceso elemental z, que es el resultado del expe- 
rimento, está contenido en S. 

Para sucesos cualesquiera S, y Sz pertenecientes al espa 
sultados del experimento Z son válidas las siguientes defi 

Se denomina reunión Sı U Sz de los sucesos Sı y Sz al suceso 
que consiste en la realización siquiera de uno de los sucesos Si 


2 
Se llama conjunción Sı f Sa de los sucesos Sı y S2 al suceso 
jue consiste en la realización de Sı y Sz. Los sucesos Sı y Sz se 
lenominan incompatibles si la realización de uno de ellos excluye 
la posibilidad de que se efectúe el otro, es decir, si Sı N S= ð. 
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Se llama complemento S del suceso S al suceso que consiste en 
el incumplimiento del suceso S. 

El suceso cierto consiste en la realización siquiera de uno de 
los sucesos del espacio Z. 

El suceso imposible es cl conjunto vacio Ø consistente en que 
no se realiza ninguno de los sucesos del espacio Z. 


Ejemplo 5-1. El experimento consiste en que se tiran dos dados de juego 
cada uno de los cuales puede caer indicando de uno a seís tantos. Introduzca» 
mos en el análisis el conjunto Y = (1, 2, .... 6), El resultado del experimento 
será el par ordenado z = (1,4), donde i, kJ, por cierto, i es el resultado al 
tirar el primer dado y A, el resultado al tirar el segundo. Es cómodo representar 
los resultados del experimento mediante los puntos en el plano (i,k) como 
se muestra en la figura 5-l. Como vemos, 


el espacio de resultados del experimento  ¿% 


constará de 36 puntos Z =((1,1), (1,2), o 
kpe S Aquí los sucesos. pueden ser muy Pp (ho ooo 
variados. Designemos por Sy el suceso que ¿| AN Aso o o 
consiste en que el dado cae señalando j tan- SS 
tos. Entonces Sa = ((,D); Sr=((1.6) sL o Moo o 
BS 60, da; (52), (6.0); Su = (65). SN 
(5.03), Sia = ((6,6)), ete. sho o oo 

Los sucesos que pueden tener lugar en el EN 
espacio finito de resultados de experimento ¿L o o ON 
Z con el conjunto vacío Ø unido a él, for- AN 
man la clase de sucesos $ denominada cia- ¿| o o a. A 


se finita aditiva, campo booleano o álgebra 
booleana y satisface las condiciones siguentes: | + 
7 


si S E Y, entonces Ss 


suo. 


entonces 


Empleando, sucesivamente estas condi- 


ES 


Fig. 51. Espacio de resultados 
del experimento al tirar dos da- 
dos de juegos 


ciones puede demostrarse que pertenecerán 
al campo booleano 45 la reunión o intersección de cualquier número finito de 
conjuntos Sa de Y, así como las diferencias de estos conjuntos. 

Si el espacio Z contiene un número finito de elementos, la clase de todos 
los sucesos posibles en dicho espacio será también finita. En este caso es con- 
veniente presentar cierta clase de conjuntos Ye en el espacio Z que puede de- 
nominarse clase inicial. Si a los conjuntos de fo se aplican un número finito 
de veces Jas condiciones indicadas, puede obtenerse la clase completa de sucesos 
que obedecen a esta condición, es decir, el campo booleano YE. En tal caso se 
ice que este campo $ ha sido originado 
sos métodos para elegir la clase inicial 
su campo booleano. 

Ejemplo 5-2. Si Bo = Z, entonces Z = Y, Luego, 2 = Ø æ Y, Por cuanto 
ZU =Z y ZØ =Ø, entonces y = (Z, Ø) es un campo booleano. 

Ejemplo 5-8. Supongamos que Ye consta de todos los sucesos elementales 
en 2. En este caso el campo booleano Y contiene un conjunto vacío, todos los 
conjuntos monoclementales de Z, todos los conjuntos bielementales de Z, .... 
y por último, el propio conjunto Z. 


r la clase inicial Yo. Existen diver» 
o cada uno de los cuales proporciona 


b) Concepto de probabilidad 


En la teoría de las probabilidades cada resultado de un experi- 
mento z = Z se considera como una magnitud aleatoria. Esto signi- 
fica que no se conoce por anticipado cuál de los resultados va a 
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tener lugar al realizar el experimento. Sin embargo es evidente, en 

rimero, que a resultas de cada experimento debe tener lugar sin 
alta algún resultado zÆ Z y. en segundo, que como consecuencia 
de un experimento no puede haber dos resultados. 

Intuitivamente se entiende por probabilidad de un resultado la 
medida numérica que caracteriza la posibilidad 'pbjetiva de un re- 
sultado dado de un experimento. Esto significa que se atribuye a 
cada uno de los elementos z Æ Z cierto peso p, es decir, un número 
real positivo al cnal se han impuesto ciertas limitaciones, 'a saber: 

1) p es tanto mayor cuanto mayor es la seguridad de que va 
a tener lugar precisamente el resultado dadó del experimento 
z6Zl; 

2) la suma de los pesos p para todos los resultados posibles 
del experimento debe ser igual a la unidad. 

La asignación del peso p = 0 a cualquier elemento z E Z signi- 
fica que el resultado dado del experimento es imposible, o sea, 
constituye un suceso Imposible. Si a algún elemento 2 = Z se atri- 
buye un peso p = 1, el resultado dado constituye un suceso cierto. 
Efectivamente, en virtud de la segunda limitación deben asignarse 
pesos p=0 a todos los elementos restantes del conjunto Z, es 
decir, los sucesos correspondientes a estos elementos son impo- 
sibles. Pero, como que obligatoriamente debe tener lugar algún 
resultado del experimento, será precisamente el resultado a que se 
asigna el peso p == l. 

El total de los pesos que se atribuyen a los distintos elementos 
del conjunto Z representa cierto conjunto P con elementos p, y el 
proceso propiamente dicho de asignación de pesos constituye el 
reflejo del conjunto Z en el conjunto P, o sea, determina las pro- 
babilidades p E P como funciones del resultado del experimento 
2 & Z, lo que puede escribirse en la forma 


p=p(). (5-3) 


Conforme a las limitaciones expuestas anteriormente las magni- 
tudes p(z) representan números reales que obedecen a las con- 
diciones 


p(2)>0; Ea de (5-4) 

El total de los pesos p(z) para todas las z Æ Z se llama distri- 
bución de probabilidades en el espacio de resultados del experi- 
mento Z y cada peso p=P atribuido a un resultado elemental 
z= Z se denomina probabilidad de un resultado dado. 


c) Probabilidad de un suceso aleatorio 


Hemos definido el suceso aleatorio S como cierto subconjunto 
del conjunto de resultados del experimento Z. Por tanto, un suceso 
aleatorio representa un conjunto que consta de una parte de los 
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elementos del conjunto Z. Entonces, se entiende por probabilidad 
del suceso S designada por Ps o P(S), la suma de los pesos que 
constituyen este suceso de los elementos: 


PS)=Ps= E plo. (6-5) 


Son casos particulares de esta fórmula: 

1) el caso en que S no contiene ningún elemento de Z, o sea, 
es un conjunto vacio; según (5-5), la probabilidad de un conjunto 
vacío es igual a cero 

Pa= 0; (5-6) 


2) el caso en que S coincide con Z, es decir, contiene todos los 
resultados posibles del experimento. Como que no puede haber 
ningún resultado de este último que no forme parte de Z, puede 
considerarse todo el espacio Z como un conjunto universal y asig- 
nársele un peso igual a la unidad. Esto concuerda absolutamente 
con la fórmula (5-5), la que, teniendo en cuenta (5-4), da: 


P¿= E,M2=1. (5-7) 


d) Espacio probabilístico 


Los razonamientos precedentes respecto a la definición de pro- 
babilidades gozan de un carácter algo intuitivo y no garantizan la 
posibilidad de calcular las probabilidades para cualquier grupo de 
sucesos capaces de ocurrir en la clase de sucesos 3. Para resolver 
este problema hay que analizar la distribución de probabilidades 
no en el espacio de resultados del experimento Z, sino en toda la 
clase de sucesos Y relacionados con dicho espacio. 

Se denomina medida probabilistica en la clase de sucesos Y 
que representan un campo booleano, la función P(S) que satisface 
las condiciones siguientes: 

1) P(S)>0, para cualquier S e 8; 

2) si Si, Sa, ..., Sn es la secuencia de sucesos incompatibles 


A P 
por pares de $, entonces r( U, s)- È P (Sa); 
i 


3) P(Z)= 1. 
Se denomina campo de probabilidad el par (3, P), es decir, el 
campo de conjuntos y la medida probabilística en éste. 

e llama espacio probabilístico a la tríada (Z, $, P), es decir, 
al espacio de sucesos elementales, al campo de conjuntos presen- 
tado en dicho espacio y a la medida probabilística definida en el 
campo de conjuntos, E k 
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5-2. CALCULO DE PROBABILIDADES 


a) Métodos de atril 
probal 


ción de la medida 
stica 


Hay una serie de métodos para atribuir pesos a ciertos elemen- 
tos z del espacio Z. Cuál de los métodos se ha de utilizar en uno 
u otro caso depende del carácter del experimento a realizar y de la 
información de que disponemos. Examinemos los métodos princi- 

ales. 

PS” Determinación de la probabilidad por medio de frecuencia. 
Analicemos el experimento con espacio de resultados 
= (21, ..., Zm}, que podemos repetir muchas veces en iguales con- 
diciones. Supongamos que se efectuaron N experimentos durante 
los cuales se obfuvo N, veces el resultado z & Z que nos interesa, 
Se denomina frecuencia del resultado z al número relativo de casos 
en los cuales tuvo lugar el resultado deseado 2, es decir, la magni- 
tud 


Nz 
aa. (6-8) 


No es difícil cerciorarse de que las frecuencias g(z) de todos los 
resultados posibles z = Z obedecen a las condiciones (5-4). 

Con un pequeño número de experimentos la frecuencia tiene, en 
notable grado, carácter aleatorio. Así pues, en caso de tirar 10 ve- 
ces una moneda ésta puede caer 2 veces de cara y al lanzarla 
otras 10 veces puede caer, por ejemplo, 8 veces. No obstante, la 

ráctica demuestra què al aumentar el número de experimentos la 
recuencia de los diferentes resultados pierde en considerable me- 
dida su carácter aleatorio y tiene la tendencia de aproximarse con 
pequeñas fluctuaciones a cierto valor medio que puede considerarse 
precisamente como la probabilidad del suceso. Sin embargo, esta 
aproximación de la frecuencia a la probabilidad, al aumentar el 
número de experimentos, difiere de la tendencia a un límite en sen- 
tido matemático. 

Asi pues, no es imposible que al lanzar 10 veces la moneda ésta 
caiga de cara todas las 10 veces. Por cuanto el resultado de lanzar 
cada moneda no depende de los resultados de los lanzamientos 
anteriores no es nada imposible que caiga de cara en 1000 ocasio- 
nes al lanzar la moneda 1000 veces. Pero las probabilidades de tal 
suceso son tan pequeñas que puede considerarse prácticamente 
irrealizable, 

En general, al aumentar el número de experimentos la frecuen- 
cia se aproxima a la probabilidad en el sentido de que la probabi- 
lidad de desviaciones de alguiza consideración de la frecuencia res- 
pecto a la probabilidad llega a ser tan pequeña que es despreciable. 
Por consiguiente, si hay la posibilidad de repetir el experimento 
varias veces en idénticas condiciones, las frecuencias de algunos 
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resultados g(z) pueden tomarse como las probabilidades de estos 
resultados. La cuestión de cuántos experimentos deben considerarse 
suficientes al determinar las probabilidades por medio de la fre- 
cuencia y cuál cs el grado de certeza de los resultados obtenidos 
al hacerlo, será estudiada más detalladamente en los capítulos de- 
dicados a los métodos de estadística matemática, 

No obstante, las dificultades debidas a la múltiple repetición 
de-los experimentos en condiciones reales obligan a utilizar otros 
métodos de determinación de la probabilidad. 

2. Uno de los métodos que puede usarse con bastante frecuencia 
(aunque no siempre) es el método basado en ej principio de igua- 
les posibilidades. 

El principio de iguales posibilidades se emplea cuando no tene- 
mos fundamento para dar preferencia a cualquier resultado del 
experimento respecto a otros resultados. En este caso hay que con- 
siderar que existen iguales posibilidades para cualquier resultado 
del experimento y atribuirles iguales probabilidades. Si en este 
caso el espacio de resultados del experimento Z consta de m ele- 
mentos y el suceso S contiene r elementos de Z, la probabilidad de 
este suceso será igual a: 


PS)=5. (5-9) 


3. El método más extendido para atribuir la medida probabilis- 
tica es la determinación de las llamadas probabilidades aprioristi- 
cas. Las probabilidades apriorísticas se determinan recopilando 
durante un prolongado lapso de tiempo los datos estadísticos sobre 
el suceso o fenómeno que nos interesan. 

Habitualmente, en las diversas esferas de la ciencia, técnica 
y vida social se efectúa la recopilación de datos estadísticos sobre 
unos u otros sucesos o fenómenos que pertenecen a la categoría 
de los aleatorios, es decir, cuyas leyes no pueden describirse con 
rigor matemático y cuya aparición no puede pronosticarse de ma- 
nera fidedigna. El estudio de cuán frecuentemente ha ocurrido 
suceso en el pasado permite determinar la probabilidad de este su- 
ceso y, por tanto, pronosticar con determinado grado de certeza la 
aparición de dicho suceso en el futuro. 

4. Las probabilidades apriorísticas sólo proporcionan una des- 
cripción fidedigna de los fenómenos en caso de mantenerse en el 
presente las condiciones en las cuales ha sucedido el fenómeno en 
el pasado. Sin embargo, está muy lejos de suceder siempre así. Por 
eso tiene gran importancia precisar las condiciones reales existen- 
tes en la actualidad, lo que puede hacerse realizando un experi- 
mento especialmente preparado. Las probabilidades determinadas 
fundándose tanto en los datos estadísticos del pasado como en un 
experimento preparado “ad hoc” se denominan probabilidades 
aposterioristicas. 
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b) Propiedades de la medida probabilística 


Ciertas propiedades de la medida probabilística son muy útiles 
para simplificar el cálculo de probabllidades de diversos sucesos 
Examinemos estas propiedades para los sucesos X, y Xa en el es- 
pacio de resultados de la prueba Z. 

1. Si Xi N X2 = Ø, entonces 


P(X, U X) = P(X) + P(Xo), (5-10) 


lo que se infiere directamente de la definición de medida probabi- 
lística. 
2. De las condiciones X U X = Z, X N X= Ø hallamos: 


PXUX)=P(X)+P(X)=1, (Y) 


P(X)=1—P(X). (5-12) 

3. Sea X, S Xy. Entonces X, puede representarse en la forma 

X= X U (Xa \ Xi), siendo X, ÑN(X:\ X)=Ø. Luego, P(X)= 

=P(X) + P(X¿N X,). Por cuanto Xx X, €Z, lo cual significa 

que P(X2x Xj)>0, obtenemos: 

PiX) > P (X); (5-13) 

P (Xa \ Xp) =P (A) — P (X1). (5-14) 

4. Para X, y Xz arbitrarias de Z representamos su reunión en 
forma de la reunión de dos conjuntos no intersecados 


de donde 


Xi U Xa= Xi U [Xa N (Xi N X2)), (5-15) 
de suerte que 
PX U Xð = P (X1) + PIX N (Xi N Xa). (5-16) 
Tomando en consideración que X, N Xz S X2, obtenemos; 
P (X1 U Xy = PX) + P (Xa) — P (X, N Xp). (5-17) 


Ejemplo 5-4. Se escoge al azar una carta de una baraja de 52 cartas. 
¿Qué probabilidad hay de que: 

y sea del palo de corazones o el rey de tréboles? 

2) sea del palo de corazones o uno de los reyes? 

Designemos por X el conjunto de corazones; Y, el conjunto de reyes y V, el 
rey de tréboles, de modo que P(X) = 1/4 P(Y) = t/i y P(V) = Ys. 

l Calculemos P(XU Y). Por cuanto XUV =Ø, entonces P(X UV) = 
POR PV) = +35 

2; Eniculemos PEU). Como que XUY xØ, entonces P(X UY) = 
AO P(Y) —PIXNY). Pero XNY es el rey de corazones, o sea, 
P(XN Y) = t/s, Luego, 


Li 1 Li 4 
PRUN= 4+ 


5-3. PROBABILIDADES CONDICIONALES 


a) Concepto de probabilidad condicional 


Examinemos cierto suceso 7 en el espacio de resultados del ex- 
perimento Z. Por definición, la probabilidad de este suceso es 


PM= Y] pz. (5-18) 
¿Er 


Supongamos ahora que sabemos que ocurrió algún otro su- 
ceso S. Se inquiere, ¿de qué manera el saber ES ocurrió el su- 
ceso S influirá sobre la probabilidad del suceso 7? 

La probabilidad del suceso 7 con la condición de que ocurrió 
otro suceso S se denomina probabilidad condicional del suceso T 
y se designa por Ps(T) o P(T]S). A diferencia de ella se llama 
probabilidad incondicional del suceso T a la probabilidad P(T). 
Ante nosotros se plantea la tarea de hallar la correlación que vin- 
cula estas dos probabilidades. 

Simplifiquemos primero el problema. Vamos a considerar que el 
conjunto T sólo consta de un elemento z Æ Z. Al determinar la 
probabilidad incondicional p(z) partimos de que puede ocurrir 
cualquier 2 E Z. Si se realiza un número suficientemente grande 
de experimentos, entonces 


Numero de experimentos 
con las z & Z dadas ——_ Nz 


7 
Numero total de experi- 
mentos 


piz) = . (5-19) 


Si se impone la condición de que ocurrió el suceso S, entonces, 
con la misma, deberán excluirse todos aquellos resultados del ex- 
perimento con los que no ocurre el suceso S, Es decir, al determi- 
nar p(z|S) hay que cambiar N por Ns, el número de experimentos, 
en los cuales ocurrió el suceso S, y N, por Ne, sy, el número de 
éstos en los que ocurrieron tanto la z dada como el suceso S. Pero 
en el caso examinado 


z, sizes; 
Ø, si zs. (5-20) 


Por eso, Niz, s= Nns. De esta suerte, 


(2, s==0s=( 


peis =p. (5-21) 


Dividiendo el numerador y denominador de esta expresión por 
el número total de experimentos N, obtenemos: 


ase. (6-22) 
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Analicemos ahora el caso en que 7 es un subconjunto arbitrario 
del conjunto Z. Teniendo en cuenta que la probabilidad de un 
suceso es igual a la suma de las probabilidades de los elementos 
que constituyen dicho suceso, obtenemos: 


È piens) 
PTIS= Y 1 E. (6-23) 
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Examinemos la suma en el numerador de la expresión dada. 
Sólo forman parte de esta los sumandos para z = T. Pero en ella 
pueden dejarse de considerar los sumandos para zS ya que 
entonces p(z ñ S)= 0. Por consiguiente, dicka mima consin de 
sumandos para los que se cumplen las condiciones 2 € T y z @ S. 
Es decir, la sumación puede cfcctuarse por z = T N S. Pero con 
ze sS plz NM S)= p(2). 


Por eso 
EP EAS) = E pe) =PTAS). (5-24) 
zer 2870S 
Teniendo en cuenta esto obtenemos: 
ers =G, (5-25) 
lo que a menudo se escribe en la forma 
P(T NS)= P(T 1S) P (9). (5-26) 


A veces se encuentran casos en que nuestro conocimiento de 
que ocurrió el suceso S no influye sobre Ja probabilidad del su- 
ceso T. En otras palabras, la probabilidad del suceso 7 no depende 
de si ocurrió o no el suceso S, de manera que 


PIS =P 1D). (5-27) 


En este caso se dice que los sucesos T y S son independientes. 
Para los sucesos independientes se cumple la correlación 


P(T NS) = P iT} P(S), (5-28) 


que frecuentemente se denomina fórmula de multiplicación de pro- 
habilidades. 


b) Magnitudes aleatorias bidimensionales 


Muy a menudo, como resultado del experimento nos interesan 
varias magnitudes aleatorias en lugar de una, por ejemplo, dos 
x e y. Así pues, al tomar una carta de la baraja pueden interesar- 
mos su palo x y valor (número de tantos) y. Al elegir en un bos- 
que árboles para una obra de construcción, nos interesan la altura 
tlel árbol x y su diámetro y. Al verificar el buen estado de los con- 
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densadores nos interesan los valores de la capacidad x y la ten- 
sión disruptiva y. 

En todos estos ejemplos hay que operar con dos conjuntos de 
magnitudes aleatorias X = {x , ..., xa) e Y = (Ys, ..-» Ymb Pero 
estos conjuntos no son independientes, sino que están vinculados 
entre sí de un modo determinado; a saber, el resultado del experi» 
mento z son dos magniludes aleatorias x= X e y & Y de modo 
que z =(x, y). Asi el conjunto de los resultados del experimento Z 
es el producto directo de los conjuntos X e Y: 


Z=XXY. (5-29) 


Examinemos algunos sucesos y sus probabilidades que pueden 
interesarnos al estudiar las magnitudes aleatorias bidimensionales. 
Vamos a ilustrar los conceptos introducidos con el ejemplo de la 
altura x y el diámetro y de los árboles en el bosque. 

Supongamos que x Œ X e y e Y son resultados de cierto expe- 
rimento. Por ejemplo, x = 30 m e y = 25 cm. Entonces puede 
surgir la necesidad de examinar las probabilidades siguientes: 

1) p(x), la probabilidad de que la altura del árbol sea 30 m. 
En el caso dado no nos interesa el diámetro del árbol; 

2) p(y), la probabilidad de que el diámetro del árbol sea 
25 cm. En este caso no nos interesa la altura del árbol, Las pro- 
babilidades p(x) y p(y) son probabilidades incondicionales de los 
índices x e y y proporcionan las distribuciones de probabilidades 
respectivamente en los conjuntos X e Y que satisfacen las condi- 
ciones (5-4). 

3) p(x, y), la probabilidad de que el árbol tiene una altura de 
30 m y un diámetro de 25 cm. Esta es la distribución conjunta de 

robabilidades de dos índices x e y presentada en el espacio 
== X X Y con los elementos z = (x, y) que obedece a las condi- 
ciones 


p% n>% Zp =l; (5.30) 


4) por último puede encontrarse la probabilidad condicional 
p(x|y), es decir, la probabilidad de que el árbol con diámetro de 
25 cm tiene una altura de 30 m. En el caso dado los árboles de 
otro diámetro simplemente no se consideran. 

Para relacionar entre si todas las probabilidades examinadas, 
designemos por x; cierto resultado x € X, y por y; cierto resultado 
y <= Y analizando dos sucesos en el espacio Ž = X X Y : T; = 
= ((%o Yi), +1 (ir 9m)) y Si = Ai, 43), oeoa (Xm Yi) 

El suceso T; consiste en que se obtuvieron el resultado dado 
xs X y cualquier y = Y. Como que en cualquier experimento 
siempre tiene lugar algún y € Y, el suceso T; consiste en que se 
obtuvo el resultado xi. De este modo, T: =x,. Análogamente, 
S; = yy No es dificil ver asimismo que Ti N S; = (xs y;)- Por: la 
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fórmula (5-25) hallamos 
Pt = E. (5-31) 


Por cuanto x; puede ser cualquier x Œ X e y, puede ser cual- 
quier y Y, omitiendo los subindices obtenemos para xs X e 
y = Y cualesquiera: 


=> X 
peN =- (5-32) 
lo que puede escribirse en la forma 
pix, y) = p(x ly) p (y). (5-33) 


Si la probabilidad del resultado x no depende de qué resul- 
tado y se obtuvo, entonces los resultados x e y son independientes. 
Para los resultados independientes se cumple la correlación 


PIN = p(x), (5-34) 
de modo que la fórmula (5-33) toma la forma: 7 
p(x, y\= p (x) p (y). (5-35) 


Notemos más adelante que al examinar una magnitud bidimen- 
sional nos es indiferente cuál de las magnitudes x o y tomamos 
como primera y cuál como segunda. intercambiando de lugares 
x e y en la fórmula (5-33), obtenemos: 


p(x, y)= p (y |x) p (x). (5-36) 
Comparando (5-33) y (5-36) hallamos que 
p(x, y) =p (x) py x)= p (y) p (x |y). (5-87) 


c) Fórmula de la probabilidad completa 


Examinemos cierto espacio de resultados del experimento Z. 
Sea T=Z un suceso en el espacio Z, y el sistema de conjuntos 


{S1, ..., Si} representa cierto fraccionamiento de dicho espacio, es 
decir, obedece a las condiciones 
Z=SU... US, S:NS:=9 parai + k. (5-38) 


En diversas ocasiones presenta interés expresar la probabilidad 
incondicional del suceso F mediante las probabilidades condicio- 
nales P(T|Sy), ..., P(T|S;) y las probabilidades incondicionales 
P(Si), <. P(S). 

Para obtener la correlación necesaria representaremos el espa- 
cio de resultados del experimento Z en la forma Z = $, U Š», 
donde 5, = S2 U... U Sı. Entonces 


P(T)=P (T IS, UŠ) =P [T N (Si Y SIAP (T AS)+P (TNS). (5-39) 
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Vamos a considerar a 5, como un nuevo espacio de resultados 
del experimento Z,, es decir, Zı = S; = S2 U... U Sro 5, = Sz U 
U Sz, donde Sz = Ss U ... U Si Entonces 


PIT AS)= PITNA (S2U 5) =P (TNS) + PTAS). (5-40) 


Luego, _ 
P(T)}= PTAS) + P(T AS) + PT NSD. 6-41) 


Al continuar realizando más adelante transformaciones análo- 
gas obtenemos: 


PT) =F PTAS)= F P(T IS) P(S). (5-42) 


La fórmula (5-42) recibió el nombre de fórmula de la probabili- 
dad completa. 


5-4, MAGNITUDES ALEATORIAS CONTINUAS 
Y SUS DISTRIBUCIONES 


a) Concepto de magnitud aleatoria continua 


Hasta aquí hemos supuesto que el espacio de resultados del 
experimento Z constituye un conjunto finito. Sin embargo, en mu- 
chos casos el resultado z del experimento puede ser cualquier valor 
en cierto intervalo a < z < b. Entonces 2 es una magnitud alea- 
toria continua en que el espacio de resultados del experimento será 
todo el intervalo de sus valores posibles: 

Z=(:4<2<0b), (5-43) 
que contiene un número infinito de puntos. En este caso ya no es 
posible hablar de la probabilidad de un resultado particular, puesto 
que con un número infinitamente grande de resultados posibles 
el peso de cada resultado será igual a cero. Por eso para una 
magnitud aleatoria continua la distribución de probabilidades se 
determina de diferente manera que en el caso discreto. Al hacerlo, 
se utilizan dos tipos de distribución denominados función de distri- 
bución de probabilidades y densidad de distribución de probabili- 
dades. 


b) Función de distribución de probabilidades 


Sean Z, el espacio de resultados del experimento de una magni- 
tud aleatoria unidimensional que toma valores reales, y R, el 
conjunto de todos fos números reales cuyos elementos designemos 
por x. La función de distribución de probabilidades F(x) deter- 
mina la probabilidad de que los valores de la magnitud aleatoria 2 
no excedan de la x dada: 


F()=P(—0 <2<x). (5-44) 
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Puede representarse el carácter general de la función F(x) 
basándose en algunas de sus propiedades; 

1) Por cuanto, para xa > xı, el intervalo (—oo, xa] está total- 
mente contenido en el intervalo (— oo, xı), según (5-44) F (xa) > 
> F (xı). Por consiguiente, F (x) es una función no decreciente, 

2) Fi—00)=0, ya que el resultado del experimento z = 
=(— oo, x) se convierte en suceso imposible para x -> — 00. 

3) F(+00)= 1, ya que el resultado del experimento z & 
E (—oo, x] se convierte en suceso cierto para x-» +00, 


Fig. 5-2. Función de distribución de probabilidades para una mag- 
nitud aleatoria continua a 


En la figura 5-2 se presenta la vista general de la función que 
satisface las propiedades estipuladas. 


c) Densidad de distribución de probabilidades 


Conociendo la función de distribución de probabilidades puede 
calcularse la probabilidad de que el valor de la magnitud aleatoria 
se encuentre dentro del pema intervalo de x a x-} Ax. Según 
(5-44) dicha probabilidad es igual a: 


F(x 4 a) —F9= LEO ax, (5-45) 

El primer factor del segundo miembro de esta expresión repre- 
senta el valor de la probabilidad correspondiente a la unidad de 
longitud del sector Ax. Si existe el límite de esta relación con 
Ax > 0, lo que se cumple, por lo común, para la mayoría de las 
magnitudes aleatorias continuas, el mismo se designa por w(x) 
y se llama densidad de distribución de las probabilidades. Asi 
pues, 


ni Fitar) F L AF (a) 
o T (5-46) 
de modo que 
F (x + Ax) — F (x) = w (x) Ax. (5-47) 


En la figura 5-3 se muestra el carácter general de la gráfica de 
la función w(x). 

Aclaremos algunas propiedades de la función w(x). Sean a y b 
puntos arbitrarios del eje real, siendo b > a. Hallemos el signi- 
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è 
ficado de la integral jow dx Sustituyendo de manera pura- 


mente formal w(x)dx por dF (x), obtenemos: 
, 


Fi 
fwijar= | dF ix)= F(b) — F (a). (5-48) 
E ria 


Pero según (5-44) esta expresión da la probabilidad de que la 
magnitud aleatoria z tome un valor que esté dentro del intervalo 
(a, b). Así 

b 
P(a <2 < b) = | w(x) dx. (5-49) 

De esta fórmula se desprende como caso particular la correla- 

ción 

40 

| aipar=1, (5-50) 
la cual muestra que la superficie limitada por la curva de la den- 
sidad de distribución de probabilidades w(x) y el eje de abscisas 
es siempre igual a la unidad. 


wiz) 


z 
y Es 


Fig. 5-3, Gráfica de densidades de la distribución de probabilidades 


La fórmula (5-49) permite expresar de modo integral la rela- 
ción entre las funciones F(x) y w(x). Comparando (5-44) con 
(5-49), hallamos que 

x 
F= | wd. (6-51) 

Los conceptos de función de distribución de probabilidades y 
densidad de distribución de probabilidades también se extienden 
fácilmente al caso de una magnitud aleatoria unidimensional. Sin 
detenernos en esta cuestión, ocupémonos del análisis de algunas 
leyes de la distribución de magnitudes aleatorias continuas. 


d) Distribución uniforme 


Si una magnitud aleatoria con igual probabilidad puede tomar 
valores cualesquiera dentro de los límites del sector del eje real 
de œ a B y no los puede tomar fuera de dicho sector, es decir, 
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tiene una densidad de distribución de las probabilidades 


a<z<B; 


(6-52) 
o, z<a, 2>p 


w()=iP 
l 


la misma se ilama distribuida uniformemente en el intervalo [a, p]. 

Es cómodo caracterizar la distribución uniforme por los pará- 
metros v = (a -+f)/2 y o =f—a denominados valor medio y 
amplitud de la distribución y designar la distribución «uniforme 
por R(v, œ). La densidad de distribución de las probabilidades 
w(2) se expresa fácilmente mediante los parámetros de distribu- 
ción R (v, œ) en la forma 


de << 
w(z)= 


(5-53) 
0o z<v-ĵ 2> + 


Ejemplo 5-5. Al redondear números hasta valores enteros, los errores de 
redondeo pueden lomar con igual probabilidad valores de —0,5 a 4-0.5, es decir, 
obedecen a la distribución R(0, 1). 

Ejemplo 5-6 Al tomar lectura en una escala con valor de una división de ô 
los errores de lectura serán magnitudes aleatorias con distribución R(0,6). 

Ejemplo 5-7. Si un trolebús circula con iftervalo de 10 min, par: pasa- 
jero que no conoce el horario, el tiempo de espera será una magnitud aleatoria 
con distribución R(5, 10). 


e) Distribución normal 


La Jey más importante de distribución de una magnitud aleato- 
ría es la ley de distribución normal o de Gauss. Esta es la que se 
encuentra más a menudo en la práctica. Además, la ley de distri- 
bución normal es la Jey límite a la cual se aproxima una serie de 
otras leyes de distribución al existir condiciones típicas que se pre- 
sentan con gran frecuencia. 

+ La ley normal se caracteriza por una función de distribución de 
las probabilidades del tipo 
tao 


Lo (5-54) 


Vin 


para — œ < z < + oo, La distribución normal se determina por 
los parámetros v, o? denominados media y dispersión que en lo 
sucesivo van a designarse por N (v, o°). En la figura 5-4 se muestra 
la gráfica de la función (5-54) para v= 1,0 y algunos valores 
de o. 

La determinación de la probabilidad de que una magnitud alea- 
toria se encuentre en el intervalo dado (a, b) del eje real consti- 
tuye una importantísima tarea de la teoría de las probabilidades.: 
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w(2) 


£n el caso de la distribución normal esta probabilidad es igual á: 


b izv 
Pía <2<0= Ne w dz. (5-55) 


Esta expresión adquiere una forma mås adecuada si se realiza 
un cambio de variable designándola por (2 — v)/o = f. 
Con esto dí = dz/o y 


PaE 
Pa<2<)= 2 y eT" at (5-56) 
E ala 


y 


: 
Pero la integral del tipo fe7™" dt no se expresa mediante 


funciones elementales. Por..eso para, el cálculo de (5-56) se em- 
plean tablas de la función especial: 


1 


D(x)= 7 fe?" at, (5-57) 
è 


denominada integral de probabilidades que se ofrecen en la mayo- 
ría de los libros sobre la teoria de las probabilidades. Tomando en 


E 0 
Fig. 5-4. Gráfica de w(2) pa 


12 4 
la distribución normal 


consideración (5-57) la probabilidad de que la magnitud aleatoria 
se halle en el intervalo (a, b) será igual a: 


Y. ss 
Al efectuar los cáldulos por la fórmula (5-58) es conveniente 


recordar las siguientes propiedades de la integral de probabilida- 
es: 


Pla<z<b=0( 


D0)=0; Di+o)=3; D=O) (559) 
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5-5. CARACTERISTICAS NUMERABLES 
DE LAS MAGNITUDES ALEATORIAS 


a) Concepto de características numerables 


La función de distribución o la densidad de distribución de pro- 
babilidades son las características más completas de las magni- 
tudes aleatorias. Sin embargo, en muchos problemas prácticos re- 
sulta difícil o casi imposible representar la función de distribución 
de probabilidades. 

Mientras tanto, para resolver diversos problemas es suficiente 
conocer sólo ciertos parámetros que caracterizan la magnitud 
aleatoria desde uno u otro punto de vista. Los parámetros nu- 
merables más difundidos que han recibido el nombre de caracte- 
rísticas numerables o momentos numerables de las magnitudes 
aleatorias son el valor medio y la dispersión o desviación media 
cuadrática, Estos se determinan fácilmente con los datos experi- 
mentales y permiten discernir en rasgos generales sobre el carácter 
de la distribución de la magnitud aleatoria. 


b) Valor medio (esperanza matemática) 
de una magnitud aleatoria 


En muchos problemas la magnitud aleatoria considerada como 
resultado posible de cierto experimento se expresa por medio de un 
número real, Como ejemplos de las magnitudes aleatorias, que 
toman un valor numérico, pueden servir: 

la cantidad de la corriente consumida por los moradores de una 
casa; 
el valor de la tensión de la red en un momento dado; 
la temperatura del aire en un momento dado del día; 
el número de partículas cósmicas que llegan a la superficie 
terrestre en la unidad de tiempo; 

el número de tantos obtenidos en el tiro al blanco por un tira- 
dor dado; 

el número de compradores en una tienda en un momento dado, 
etc. 
Para todos estos casos, su valor medio o esperanza matemática 
es una importante característica numérica de la magnitud alea- 
toria. 

Supongamos que los elementos del espacio de resultados del 
experimento Z = (21, ..., Zm} admiten estimación numérica. Si 
con N pruebas el resultado Z, sucedió r; veces, ..., el resultado Zm 
ocurrió fm veces, de suerte que rı +...-+ fm = N, el valor medio 
de la magnitud aleatoria z que se designa por M(2) o Z, es 
igual a: 


E A (5-50) 


il 
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Si el número de pruebas N fue suficientemente grande, la rela- 
ción r¡/N = p; puede considerarse como la probabilidad del resul- 
tado z;. Entonces, omitiendo los subíndices, la fórmula para deter- 
minar el valor medio puede escribirse en la forma 


M(2)= z= 2 2p'2). (5-61) 


El valor medio M(2) determinado por la fórmula (5-61) se de- 
nomina comúnmente esperanza matemática de la magnitud alea- 
toria 2, 

La fórmula (5-61) puede servir para determinar el valor medio 
en caso de que el espacio de resultados de la prueba Z sea un 
conjunto finito. Ahora bien, si z es una magnitud aleatoria conti- 
nua con densidad de distribución de probabilidades w(2), por p(z} 
en la fórmula (5-61) puede entenderse la probabilidad de que el 
valor de la magnitud aleatoria se halle entre los límites de 2 a 
2 + Az, es decir, suponerse que p(z) = w(z)Az. Pasando al límite 
con Az — 0 y sustituyendo, respectivamente, Az por dz y la suma 
por la integral, obtenemos: 

+æ 


M()=23= | zw(2) dz. (5-62) 


c) Valor medio de una función de magnitud aleatoria 


En la práctica, a menudo encontramos problemas en los que 1a 
magnitud aleatoria no se expresa con un número. Así pues, la pro- 
ducción elaborada por una fábrica se divide en útil y defectuosa. 
Al lanzar una moneda, el resultado del experimento puede ser 
“cara” o “cruz”. Una carta sacada de la baraja al azar se caracte- 
riza por su nombre y palo, La señal radar recibida contiene infor- 
mación sobre la presencia o ausencia del objetivo, etc. En todos 
estos ejemplos las magnitudes aleatorias presentan diferencia no 
cuantitativa sino sólo cualitativa. No obstante, por lo común es 
posible introducir también la estimación cuantitativa para las 
magnitudes aleatorias que solamente presentan diferencias cuali- 
tativas. 

Consideramos la magnitud aleatoria como el resultado de cierto. 
experimento que se realiza artificialmente o es el resultado de 
un proceso natural. Con esto hay que recordar que cualquier expe- 
rimento requiere algunos gastos y se realiza no para satisfacer 
nuestra curiosidad, sino para alcanzar un objetivo determinado. 
Uno u otro resultado del experimento es deseable o indeseable de- 
pendiendo de hasta qué punto se logra el objetivo propuesto. La 
consecución del objetivo deseado puede considerarse como ganan- 
cia o ventaja y su no consecución, como pérdida o desventaja. 
Tanto lo ganado como lo perdido puede expresarse con números 
que representan, por ejemplo, ciertas sumas de dinero en rublos. 
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De esta manera, a cada resultado de la experiencia z = Z 
puede ponerse en correspondencia cierta estimación numérica, 
o sea, puede efectuarse el reflejo f del espacio de resultados del ex- 
perimento Z en el conjunto de números reales R 


Fiz=>R. (5-63) 


Este reflejo proporciona la función real f(z) definida en Z, con 
la que podemos operar como con una magnitud aleatoria y, en 
particular, determinar su valor medio. 

Sea f(2) cierta función numérica definida en el conjunto Z. 
Esto significa que a los elementos zı, ..., Zm del conjunto Z co- 
rresponden Jos valores f(21), -.., f(2m) de la función. Las probabi- 
lidades de estos valores serán las mismas que las de las magni- 
tudes aleatorias 21, . . . , Zm. De este modo, p(2) representa la distri- 
bución de las probabilidades tanto para la magnitud aleatoria z 
como, asimismo, para la función de la magnitud aleatoria f(z). 
Por consiguiente, el valor medio de la función de una magnitud 
aleatoria puede encontrarse por las fórmulas para el valor medio 
de mee magnitud aleatoria gracias a la sustitución de z por f(z), 
es decir, 


mie =To= E Harta (5-64) 
para una magnitud aleatoria discreta, y 
Mtor=F= | rawea (5-65) 


para una continua. e 

Notemos que la magnitu P calculada por la fórmula (5-64) 
depende de la distribución de probabilidades p(z). Esto quiere 
decir que si cambia la distribución de probabilidades p(z) en el 
espacio Z, cambia también el valor medio de la función f(z). Para 
recalcar esta circunstancia vamos a designar a veces por f (p) el 


valor medio de la función F(Z), suponiendo que 
o=T. (5-66) 


El empleo en el caso dado, para designar el valor medio de la 
función, de la misma. letra f que para denotar la propia función, es 
admisible y no puede provocar confusiones ya que las funciones 
f(z) y F(p) están definidas en conjuntos diferentes: la función f(z) 
en el espacio de resultados del experimento Z, y f (p) en el espacio 
de todas las distribuciones posibles de probabilidades p(2). 

Ejemplo 6-8. La probabilidad de que el apurato producido por una fábrica 
resulte defectuoso es igual a p. 


¿Cuál es la ganancia media correspondiente a un aparato, sí q es el costo 
de producción y b, el precio del: mismo? 
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Utilizando la fórmula (5-64), hallamos que. 
F= (b — a) (1 — p) — ap =b (1 — p) — a- 


En muchos problemas el valor medio se considera como la ganancia media 
con un gran número de experimentos. En este caso se considera racional levar 
a cabo el experimento si F(z) =/(p) = 0. 

Otra interpretación del valor medio se refiere a las apuestas. Supongamos 
que cierto suceso puede ocurrir con la probabilidad p. El hacer una apuesta 
presupone que uno de los participantes está de acuerdo en pagar la suma b si 
no oceyre un suceso a condición de que el otro participante le pague la suma a 
si éste ocurre. De este modo, el primer participante recibe la suma a con la 
probabilidad p y paga la suma b con la probabilidad +—p. Su ganancia 


media es 
Ho) =ap— b (1 — p). (5-67) 


La apuesta se considera equitativa si la ganancia media resulta igual a cero, 
o sea, bajo la condición de que 


=2. (5-63) 


Teorema 5-1 (teorema del valor medio). Utilizando para deter- 
minar f(p) la expresión (5-64) y sustituyendo en cada sumando 
f(z) por min f(z), obtenemos la correlación 

z 


Flo) => mín f (2) p p(z) = mín [(2), (5-69) 


que viene a expresar el teorema del valor medio. 


d) Valor medio de una función de dos magnitudes 
aleatorias 


En muchos casos se requiere operar no con uno sino con varios 
sucesos aleatorios e introducir una función real que depende de los 
resultados de cada uno de estos sucesos. Asi, por ejemplo, en las 
competiciones de atletismo el resultado de cada participante es un 
suceso aleatorio. Ahora bien, el Jugar ocupado por el equipo es 
función tanto de los resultados de los miembros de su propio 
equipo, como de los resultados de los miembros del equipo rival. 

os limitaremos al análisis de dos magnitudes aleatorias inde- 
pendientes para las que designaremos, respectivamente, por X e Y 
los espacios de resultados del experimento. Designemos por pio) 
y 0) la distribución de las probabilidades en los espacios X e 

ea f(x, y) una función real determinada para xæ X e ys Y 
cualesquiera. Entonces se dice que la función f(x, y) está presen- 
tada en el producto directo de los conjuntos X X Y. El valor medio 
de esta función dependerá del carácter de las distribuciones de 
probabilidades p(x) y (y) asi que puede escribirse: 


Mi, y= F, =i ip, q). (5-70) 


Para determinar f(p, q) presentaremos cierta y & Y determi- 
nada. Con la y propuesta la función f (x, y) solamente lo será de x 
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y su valor medio, que sólo dependerá de p(x), puede designarse 
por fp(y) y se halla por la fórmula (5-64): 


Meli A= h= EE, Ye. (5-71) 


La magnitud [, (y) ya no depende de x sino solamente de y. La 
promediación por y de esta magnitud da [(p, q): 


Fp. D= Myli l= z tridaw= E fx upay) (5-72) 


Er 


e) Esperanza matemática condicional 


Sea Z el espacio de resultados del experimento y f(z), cierta 
función numérica presentada en el conjunto Z cuyo valor medio 
o esperanza matemática se determina por la expresión (5-64). 

Supongamos ahora que ocurrió el suceso S = Z. Entonces la 
distribución de probabilidades p(2) se sustituye por la distribución 
condicional de probabilidades p(z|S). Si en la fórmula para el 
valor medio ponemos en lugar de p(z) la magnitud PS. obte- 
nemos la esperanza matemática condicional de la función f(z): 


S i ISLAS 
M PIS), HP (els) SFT À] eNS) TT 


ras 


(5-73) 


E) Propiedades del valor medio 


1. El valor medio de una magnitud no aleatoria es igual a la 
misma magnitud. 

Sea c una magnitud no aleatoria, es decir, constante. Enton- 
ces c puede considerarse como el resultado de un experimento en 
el cual el espacio de resultados Z consta de un solo elemento c de 
suerte que p(c)= 1. Por la fórmula (5-61) hallamos que 


M(0)=cp(c)=c. (5-74) 
2, El factor constante puede sacarse del signo de valor medio 
M(cz2)= 2 czp(z)=c Y zp(2)=cM (2). (5-75) 

Ez EA 


3. El valor medio de una suma de magnitudes aleatorias es 
igual a la suma de sus valores medios. 

Sean x e y magnitudes aleatorias que tienen espacios de resul- 
tados del experimento X e Y y distribuciones de probabilidades en 
estos espacios p(x) y g(y). Designemos f(x, y)= x + y. Por la 
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fórmula (5-72) encontramos que 
y LONA EAE) 
+ Eva WErd=2Z xp (0) + z Y (y=2+3. (5-76) 


4. La esperanza matemática de una magnitud aleatoria cen- 
trada es igual a cero. 


Sea x una magnitud aleatoria y v, su valor medio. La magnitud 


aleatoria 2=2—»v se denomina magnitud aleatoria centrada. 
Para la magnitud aleatoria centrada tenemos: 


MÈ) = M (z —v)= M (z) —v=0. (6-77) 


g) Momentos. Dispersión. Desviación cuadrática media 


Más importantes características numéricas de una magnitud 
aleatoria son sus momentos que se dividen en iniciales y centrales. 

El momento inicial de orden s de la magnitud alcatoria 2 se 
determina por las fórmulas: 


a (2)=2 2'p(2) (6-78) 
para una magnitud aleatoria discreta, y 
+. 
a (z)= | 2wíz)dz (5-79) 


para una magnitud aleatoria continua. 

No es difícil observar que el valor medio M (z) = Z, designado 
a continuación por v o va constituye el momento inicial de primer 
orden a(z). El momento inicial de segundo orden es el valor 
medio del cuadrado de la magnitud aleatoria 


ar (2)= z Zp(2)=M(2)=2 (5-80) 


Si en calidad de magnitud aleatoria se utiliza la magnitud 
aleatoria centrada 2 = z — v, las fórmulas (5-78) y (5-79) brin- 
dan expresiones para los momentos centrales de orden s, designa- 
dos por p(z). Como se ve en la correlación (5-77) el momento 
central de primer orden es igual a cero. 

Sirve como importante característica numérica de una magni- 
tud aleatoria el momento central de segundo orden llamado dis- 
persión de la magnitud aleatoria z que se designa por D(z) o 
D:. Las fórmulas para determinar la dispersión tienen el aspecto: 


Di2)= m (2)= Ze- va? p (2) (5-81) 


155 


para una magnitud aleatoria discreta y 
ps 


Da= me) = | (2 


va} w(2) dz (5-82) 


para una magnitud aleatoria continua. La dispersión caracteriza 
la desviación de los valores aislados de la magnitud aleatoria 
respecto al valor medio, o sea, constituye la característica de dis- 
persión de una magnitud aleatoria. Cuanto menor es la dispersión, 
tanto más estrechamente se concentran en las cercanías del valor 
medio los valores aislados de la magnitud aleatoria. 

En una serie de casos la dispersión no resulta cómoda para 
su empleo práctico ya que tiene una dimensionalidad igual al cua- 
drado de la magnitud aleatoria. Por eso, se utiliza frecuentemente 
como caracteristica de dispersión de una magnitud aleatoria, la 
raiz cuadrada de la dispersión que ha recibido el nombre de des- 
viación cuadrática media que se designa por o 0 oz: 


0,=VDG. (5-83) 


Anotemos algunas propiedades de la dispersión. 
1. La dispersión de una magnitud no aleatoria es igual a cero: 


D(c)=M[(c —¿*]=M(0)=0. (5-84) 


2. La magnitud no aleatoria puede sacarse del signo de de- 
presión elevándola al cuadrado: 


D(cz) = M ((cz — cv)] =c*D (2). (5-85) 


Más adelante estudiaremos algunas otras propiedades de la dis- 
persión. 


h) Regresión y correlación 


En los casos en que es necesario trabajar con varias magnitu- 
des aleatorias, por ejemplo, con dos, el valor medio y la dispersión 
pueden caracterizar por separado cada una de estas magnitudes. 
No obstante, en semejantes casos es muy importante conocer la 
influencia de una magnitud sobre la otra, o sea, tomar en conside- 
ración el carácter de'la conexión entre las magnitudes aleatorias. 
La regresión y la correlación sirven precisamente para expresar 
esta conexión de manera cuantitativa. 

Sean x e y dos magnitudes aleatorias similares a aquellas que 
se estudiaron en el $ 5-3. Para concretar, vamos a suponer que x 
representa la altura, e y, el diámetro de los árboles en una parcela 
de bosque. A cada árbol va a corresponder un punto en el plano 
(x, y), y la totalidad de los árboles se representará por el conjunto 
de los puntos mostrados en la figura 5-5. En el caso examinado 
las fagnitudes vs = % y vy =.f dan el valór medio de la altura 
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y dei diámetro de los árboles, y øx, oy caracterizan la dispersión 
de la altura y del diámetro con respecto a los valores medios. 

Junto con el análisis de la altura y del diámetro medios, pre- 
senta gran interés el estudio de la variación del diámetro en de- 
pendencia de la altura del árbol. Sin embargo, el diámetro y es 
una magnitud aleatoria para los árboles que tienen la misma al- 
tura x. Por eso sólo puede hablarse sobre la dependencia del valor 
medio del diámetro Y respecto a la altura `x, o sea, determinarse 
la magnitud g(x) que constituye el valor medio condicional 
Myx), Empleando (5-73) y designando por p(x, y) la probabili- 
dad compatible de los valores dados x e y, 


hallamos: 
TAO) 
g()=M = LL ——. (5:86) 
y) lx) PIET (5-86) 
7 


Determinando J(x) para diversas x, 
podemos construir, como se muestra en la Fig. 5-5. Línea de regre- 
igura 5-5, la línea que expone gráficamen- sión J(x) 
te esta dependencia y que se denomina 
línea de regresión de y por x. Análogamente puede obtenerse la 
dependencia Z(y) = M (0) llamada regresión de x por y. 

Nos limitaremos a estudiar la regresión para el caso de la re- 
presión lineal, el más sencillo y que se encuentrà con la mayor 
recuencia en la práctica, es decir, cuando la linea de regresión es 
una línea recta cuya ecuación puede escribirse en la forma 


D() =a + b(x—3). (5-87) 


Elijamos los coeficientes a y b de tal modo que obtengamos 
la mayor concentración de puntos (x, y) en las cercanías de la 
recta ğ(x) lo que puede expresarse por la condición 


vía, b)=M (ly — 3 (1?) = mín. (5-88) 


Teniendo en cuenta (5-87) la condición (5-88) brinda el si- 
guiente sistema de ecuaciones para determinar a y b: 


ğ—a=0; + 
Mly(e—3)] —b0?=0. } 15:89) 
Denominemos covarianza entre x e y la magnitud 
Bzy= cov (x, y) =M (y — pë — 2)l. (5-90) 
Es fácil ver que uxy puede representarse como 
By M ly — i (e — 31 = 
i =Mly œ —2)] — gM (x —3)=Mly(x—2)]. . (5-91) 
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Tomando en consideración (5-91), de (5-89) encontramos los 
valores a y b que definen las líneas de regresión: 


Bry 
b= E (5-92) 


La covarianza pzy puede servir de medida de la correlación 
entre las magnitudes aleatorias x e y. Pero, por cuanto nas hemos 
limitado al análisis del caso en que la línea de regresión es una 
recta, la covarianza no va a caracterizar la correlación cualquiera, 
sino solamente la lineal, es decir, la 
tendencia de una magnitud aleatoria a 
crecer o decrecer en promedio según la 
ley lineal al crecer o decrecer otra 
magnitud aleatoria. Para representar 
con más claridad cómo depende la cova- 
rianza del carácter de la correlación 
entre las eos aleatorias será 

i regresión Útil examinar los casos extremos. 
Pig, ped proa ato: 1. Hay = 0. Esto significa que b=0, 
rías independientes ğ =a y la línea de regresión es hori- 
zontal como se muestra en la figura 5-6. 
Como vemos, en los puntos experimentales los valores y se agru: 
pan alrededor del valor a independientemente del valor x. Luego, 
en el caso dado x e y son las magnitudes aleatorias indepen- 
dientes. 

2. La correlación entre x e y será la más estrecha si dichas 
magnitudes están ligadas mediante una dependencia funcional li- 
neal. Entonces, todos los puntos experimentales van a estar en la 
línea de regresión de tal modo que y = J(x). Sustituyendo J(x) 
por y transcribamos la ecuación de la línea de regresión en la 
jorma 


y= j=j e-a (5-93) 
Hallamos la dispersión og para este caso: 
r 1 
My — ==. (5-94) 
de donde 
Bzy = 0x0. (5-95) 


Así pues, dependiendo del grado de correlación entre las magni- 
tudes x e y, la covarianza px, puede cambiar de 0 a 0,0. 

Es un poco incómodo estimar con ayuda de la covarianza pzy 
cuán estrecho es el nexo entre las magnitudes aleatorias x e y,ya 
«que psy depende de la dispersión de éstas. Más cómodo resulta 
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utilizar con dicho objetivo el coeficiente de correlación 


Bay 


Ta a (5-96) 

que puede fluctuar entre los límites desde cero para las magnitu- 

es aleatorias independientes, hasta la unidad, si las magnitudes 

aleatorias están relacionadas mediante una dependencia funcional 
lineal. 

El empleo del concepto de covarianza permite obtener correla- 
ciones sencillas para el valor medio del producto y la dispersión 
de la suma de dos magnitudes aleatorias. 

Proponemos al lector comprobar por sí mismo que en estos 
casos se emplean las correlaciones 


y= ij + huyi (5-97) 
D(x + y) = D (x) + D (y) + 2txy. (5-98) 
Cuando las magnitudes aleatorias x e y son independientes, 
W= š; (5-99) 
D(x+ y)= D(x) +D (y). (5-100) 


5-6. PROCESOS ESTOCASTICOS DISCRETOS 
a) Tipos de procesos estocásticos discretos 


Supongamos que cierto sistema que se halla bajo la influencia 
del total de condiciones exteriores puede alterar casualmente su 
estado en los momentos de tiempo discretos designados conven- 
cionalmente por 0, 1, ...; los intervalos entre ellos se denominan 
pasos. Entonces, a resultas del n-esimo paso el sistema toma el 
estado xn, que podemos considerar como el resultado de cierto ex- 
perimento y, por consiguiente, será elemento del conjunto de los 
resultados admisibles para este paso: 


Z= {2p 2h e ay 


Consideremos que-el conjunto Zo consta de un solo elemento 
2% que representa el estado inicial del sistema. La secuencia de 
estados asumidos por el sistema xo, xı ... se denomina proceso 
estocástico. 

El proceso estocástico estará presentado si en cada paso está 
dada la distribución de probabilidades en el espacio de resultados 
que determina los estados a los que puede pasar el sistema como 
resultado del paso siguiente. Esta distribución de probabilidades 
depende, en el caso general, de los estados asumidos en todos los 
pasos anteriores, y para cualquier n, se determina por el juego de 
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probabilidades condicionales: 
Pl =P Jj i) =0, dc. Ly (56-101) 


a a 


siendo A 
E RU o = (5-102) 


El proceso estocástico va a continuar infinitamente si no lo 
rompemos artificialmente en algún paso. En la práctica siempre 
nos es necesario interrumpir el proceso después de un número fi- 
nito determinado de pasos, es decir, operar con procesos finitos o 
de pasos múltiples. No obstante, los procesos infinitos son aproxi- 
maciones útiles de los procesos finitos que son más reales, máxime 
que a menudo éstos resultan más sencillos desde el punto de vista 
analítico, 

Se denomina no controlado el proceso estocástico en el cual no 
podemos intervenir, o sea, influir en la distribución de probabilida- 
des (5-101). 

Según la índole de la distribución de probabilidades (5-101), 
los procesos estocásticos se dividen en una serie de tipos de los 
cuales los más difundidos son los procesos con valores indepen- 
dientes, los de pruebas indépendientes y las cadenas de Márkov. 

Un proceso estocástico finito se denomina proceso con valores 
independientes si la distribución de probabilidades en el espacio 
de resultados durante cada paso no depende de los resultados de 
los pasos anteriores: 


P(x,=2|%, 1) =P (x, = zg). (5-103) 

Es cómodo designar esta distribución de probabilidades simple- 
mente por pa (2), donde z & Zn, n = 0, 1... 

Una importante propiedad del proceso con valores independien- 
tes consiste en que cualquier secuencia de estados Xo, Xi, ..., Xn 
puede considerarse como el total de los resultados independientes 
del experimento. Luego, la probabilidad de que aparezca esta se: 
cuencia será igual al producto de las probabilidades de los resul- 
tados que forman parte de ella, lo que puede escribirse en la forma 


PÀXo Xis <> Xn) = Polxo) pr (%1) ~- - Pa ln) 
“eZ, i=0,1, n. (5-104) 
Un importante caso particular de procesos con valores inde: 
pendientes son los procesos de pruebas independientes. El procesó 


de pruebas independientes es un proceso con valores independien- 
tes en el cual el espacio de resultados del experimento Z 


= (Zo, 21 ..., 21) y la distribución de probabilidades en este es- 
pacio son iguales en cada paso, es decir, 
Pai2)= Pm(2)= p {2) (5-105) 
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con cualquier z = Z y cualesquiera m y n. En otras palabras, el 
proceso de pruebas independientes constituye la múltiple repeti- 
ción de un mismo experimento en las mismas condiciones. 

Como en el caso de los procesos con valores independientes, la 
probabilidad de obtener una secuencia concreta de resultados del 
experimento xo, Xi, ..., Xa en el proceso de pruebas independien- 
tes, es igual al producto de las probabilidades de los resultados se- 
parados. 

Un proceso estocástico se denomina cadena de Márkov si el es- 
pacio de estados Z = (Zo, 21, ..., 21) es el mismo para cada paso 
y la distribución de probabilidades de los resultados en cada paso 
sólo depende de los resultados del paso anterior, de suerte que 


P (Xa+ =Z Ko) 01 Xa) = P (Sny = Z | Xa). (5-106) 


Es conveniente introducir otras designaciones para las probabi- 
lidades del tipo (5-106). Supongamos que en el n-ésimo paso el 
sistema se hallaba en el estado z; € Z. Entonces la distribución 
de probabilidades (5-106) determinara la probabiladad de que en 
el paso (n + 1) el sistema se halle en el estado z;  Z. En el caso 
general dicha probabilidad depende del número del paso y puede 
designarse por p; (n). De esta manera, las probabilidades 


Pu (m) = P (Xa41 = Zi) Xn = 2), (5-107) 
que satisface la condición a 
pu(m>0, PA (M=1, (5-108) 


son las probabilidades de transición del estado z; al estado 2, en 
el paso n. 

La cadena de Márkov se llama no homogénea en caso de que 
las probábilidades de transición pi,(n) dependan del número del 
paso n. Sin embargo, juegan un gran papel en diversas aplicacio- 
nes las cadenas de Márkov homogéneas en las que las posibilida- 
des de transición se mantienen iguales para cualquier paso y pue- 
den designarse simplemente por psj 


b) Proceso de pruebas independientes con dos resultados. 
Distribución binomial de probabilidades 


Examinemos más detalladamente el caso en que en el proceso 
de pruebas independientes sólo nos interesan dos resultados de 
cada experimento, a saber, ocurrirá o no cierto suceso S como re- 
sultado de dicho experimento. Vamos a denominar éxito a un resul- 
tado del experimento y fracaso, al otro. 

Designemos por p la probabilidad de éxito en un experimento 
aislado, y por q = 1—p, la probabilidad de fracaso. Hagámonos 
la pregunta cuál es la probabilidad w (r, n, p) de que con n experi- 
mentos vayan a ocurrir r éxitos, 
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Para mayor comodidad, designemos por 1 el éxito del experi- 
mento y por O, su fracaso. Con esto, al logro de r éxitos con n 
experimentos va a corresponder una secuencia de n resultados que 
consta de r unidades y n— 7 ceros. Como que los resultados de 
los éxitos separados son independientes, la probabilidad de esta 
Secuencia es igual al producto de las probabilidades de dichos re- 
sultados separados y se determina por la expresión 


pro”. - (5-109) 
El número total de distintas secuencias de n elementos que 


contienen r unidades, es igual al número de combinaciones de n 
elementos por r, es decir, 


(D="tr (5-110) 


Ya que todas estas secuencias son incompatibles (si apareció 
una de ellas, queda excluida la posibilidad de que surja cualquier 


mtr,10,4) 


Fig. 5-7 Distribución binomial 


otra), la probabilidad de que aparezca cualquiera de ellas será 
igual a: 


w(r, n, mi). (5-111) 


Es fácil comprobar que con esto la probabilidad suma de que 
aparezca cualquier número de sucesos de 0 a n es igual a la 
unidad. 

La distribución de probabilidades determinada por la fórmula 
(5-111) se lama distribución binomial. Para representar clara- 
mente la naturaleza de la distribución binomial, en la figura 5-7 
se muestra la gráfica de dependencia de las ordenadas de esta dis- 
tribución respecto a r para n == 10 y p = Ys, es decir, la gráfica 
de distribución w (7, 10, Ys). 

Muy a menudo, es necesario determinar el valor r con el que 
la distribución binomial alcanza el máximo, Calculemos previa- 
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mente la relación de dos ordenadas adyacentes de la distribución 
binomial 


n gar 
wtr, n, p) Mer =ar, 6112) 
EA (Eo ra 


Esta relación no será menor de la unidad si r>(n-+1)p. 
Luego, la función w(r, n, p) alcanza su máximo dado 


r=entín+ lp, (5-113) 


donde se ha designado por ent x la parte entera del número x. | 

Sirven de características numéricas de la distribución binomial 
el valor medio v, y la dispersión o? que se determinan por las 
correlaciones 


Y =np 0 =npg (5-114) 


c) Distribución de Poisson 


Los valores w(r, n, p) son de difícil cálculo en caso de ser 

randes las n. Sin embargo, hay métodos aproximados que simpli- 

Fan notablemente el cálculo de estas probabilidades. Uno de ellos 

es sustituir la distribución binomial por ta de Poisson. 

Sea w(r, n, p) la distribución binomial. Es fácil cerciorarse de 

ue el límite de esta distribución con n > œ y p +0 a condición 
le que np = a = const, de suerte que p = a/n es, 


. (5-115) 


tm w(r, n, nja) = LE. 
qa. 


La distribución del tipo (5-115) se designa por w(r,a) y se 
llama distribución de Poisson. De esta manera, 


wir, a ES, (5-116) 


Constituye una particularidad característica de la distribución 
de Poisson el hecho de que el valor medio y la dispersión de esta 
distribución son iguales y valen a a. 

La distribución de Poisson constituye una buena aproximación 
a la distribución binomial con pequeñas p. Así, para p< 0,01 
puede sustituirse el cálculo de lá distribución binomial por el cóm- 
puto de la distribución de Poisson comenzando por n = 10. 

Aunque hemos llegado a la distribución de Poisson como al 
caso extremo de distribución binomial, no obstante, ella representa 
una distribución de clase independiente de los procesos estocásti- 
cos, denominada clase de fenómenos aleatorios raros. 

Examinemos la secuencia de sucesos S que siguen uno tras 
otro al cabo de intervalos de tiempo aleatorios. El número de estos 
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sucesos qué ocurren en un intervalo de duración + será una magni- 
tud aleatoria con valor medio de åt donde ) es el número medio 
de sucesos en la unidad de tiempo. Impongámonos la tarea de 
determinar la probabilidad de que en el intervalo t ocurran exacta- 
mente r sucesos. 

Vamos a considerar raros los sucesos S en el sentido de que 
puede dividirse el intervalo z en pequeños intervalos de duración 
Ar en cada uno de los cuales no puede ocurrir más de un suceso S- 
El número total de estos intervalos es igual a n = 1/Yr y la pro- 
babilidad de que el suceso ocurra en uno de los intervalos Ar, igual 
ap vin, de modo que np = %t. Por cuanto puede considerarse 
que en cada uno de los intervalos Ar el suceso S ocurre indepen- 
dientemente de si acacció y no en otros intervalos, arribamos al 
proceso de pruebas independientes con distribución de probabili- 
dades w(r, n, p), donde np = 7x1. 

Sin embargo, la suposición de que en el intervalo Ar no puede 
ocurrir más de un suceso S, sólo quedará justificada en el caso en 
que la duración de dicho intervalo sea muy pequeña, es decir, en 
el límite con At—0, Entonces, como n= œ y p->0, dado np = 
== Mt = const, el proceso de los fenómenos “raros obedece a la 
ley de Poisson con la distribución de probabilidades 


(Ae 
Al d 


wr, 41)= (5-117) 


d) Distribución exponencial. Concepto de fiabilidad 


En muchos problemas es de interés la distribución de probabili- 
dades para los intervalos de tiempo entre los sucesos aleatorios en 
el proceso de pruebas independientes. De la fórmula (5-117) para 
r == 0 y r = 1 obtenemos: 

e^ es la probabilidad de que en el intervalo de duración t no 
acontecerá ningún suceso; 

dae es la probabilidad de que en el intervalo de duración + 
ocurra exactamente un suceso. 

La probabilidad de que en el intervalo de duración r ocurra 
más de un suceso, es igual a: 


E o 


[10 + %GÉ-—...]= . 6-118) 


Como vemos, esta probabilidad es proporcional a la magnitud 
(21)2, lo que significa que con pequeñas At podemos despreciar la 
probabilidad de que tengan lugar dos o más sucesos en el inter- 
valo r. Entonces, la probabilidad de que acontezca un suceso en el 
intervalo t será igual a: 3 


Fh, )=1—e 


10 (5-119) 
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Dicho con propiedad, la expresión (5-119) determina la probabi- 
lidad de que el tiempo en el cual ocurre un suceso no exceda de t. 
Difcrenciando (5-119) por t obtendremos la densidad de distribu- 
ción para esta probabilidad que representa la probabilidad de que 
el suceso ocurra en el momento +: 


w(A, =e, 1>0. (5-120) 


Conociendo la densidad de distribución para t cs fácil deter- 
minar el tiempo medio durante el cual no ocurre ningún suceso: 


Tma= | robar =>. (5-121) 
¿ 


Las fórmulas (5-119) y (5-120) definen la distribución expo- 
nencial que juega importante papel en la teoría de la fiabilidad. 

Supongamos que cierto dispositivo consta de un gran número 
de elementos, cada uno de los cuales puede averiarse con el tiempo. 
La averia del elemento se llama su falla. En la mayoría de 15% 
casos las fallas de algunos elementos ocurren independientemente 
unas de otras y su secuencia puede considerarse como un proceso 
de sucesos independientes en el cual } determina el número de 
fallas en la unidad de tiempo y se llama intensidad de fallas y la 
magnitud 1/, según (5-121) determina el tiempo medio de fun- 
cionamiento sin fallas. 

Habitualmente se emplea como característica de fiabilidad del 
equipo, la magnitud A(r) denominada peligro de falla, que expresa 
la densidad de distribución de la probabilidad de falla en el mo- 
mento v bajo la condición de que no han ocurrido fallas hasta 
ese momento, 

Definiremos previamente la magnitud Ak (1) Ar que da la probabi- 
lidad de que la falla ocurrirá en el intervalo Ar bajo la condi- 
ción de que con anterioridad no ha habido fallas durante un 
tiempo v. Por la fórmula de la probabilidad condicional 


hone EE, (5-122) 
de donde hallamos que i 
0 E. (5-123) 


Para la distribución exponencial tenemos: 
remir 
h= rE (5-124) 


es decir, la función del peligro es constante e igual a la intensidad 
de fallas. 


La experiencia de explotación de equipos radioelectrónicos 
demuestra que la gráfica de la función / (1) tiene el aspecto de la 
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curva representada en la figura 5-8. La sección inicial de esta 
curva se caracteriza por una elevada intensidad de fallas que se 
explica por la existencia en algunos elementos de los defectos ocul- 
los que se ponen de manifiesto durante el período inicial de 
funcionamiento, La intensidad de fallas también crece con gran- 
des x, lo que es debido al “envejecimiento” de los elementos que 
se manifiesta en que empeoran las propiedades de éstos después de 
una prolongada explotación. La intensidad constante de las fallas 
y, vale decir, la distribución exponencial sólo existe en la sección 
media de la gráfica h(t). 

No obstante, es posible librarse de la elevada intensidad de las 
fallas en el período inicial, sometiendo previamente el equipo a 
“entrenamiento” antes de comenzar su explotación. Por otro lado, 
el crecimiento ininterrumpido de los requerimientos de calidad del 
equipo, resultado del progreso técnico, conduce a que con el tiempo, 
la calidad de éste deja de satisfacer las nuevas exigencias más 


Ao 


e 
Fig. 5-8 Aspecto tipico de la distribución del tiempo hasta la falla 


elevadas. Ocurre el gasto moral del equipo que generalmente co- 
mienza antes que se inicie un envejecimiento manifiesto de los di- 
ferentes elementos. Esto sirve de fundamento en muchos casos 
para considerar que la dependencia h(t) es constante e igual a 2 
durante todo el período de explotación del equipo, o sea, para 
emplear la ley exponencial de distribución al evaluar la fiabilidad. 


e) Cadenas de Márkov 


Sea Z = (21, ..., Zz} el espacio de resultados del experimento 
o el espacio de estados de cierto sistema, igual para cada paso del 
proceso estocástico. En tales casos es cómodo designar los estados 
del sistema simplemente por los subíndices de 2, entendiendo por j 
el estado z; E Z. Con esto, el espacio de estados va a representarse 
mediante el conjunto de subíndices J = (1, ...., L}. 

Designemos por m= (h, +++, 7E) la distribución de proba- 
bilidades en el conjunto J para el n-ésimo paso. Entonces, a 
determina la probabilidad de que en el n-ésimo paso el sistema se 
halle en el estado j. Como ya se ha indicado, el proceso estocástico 
constituye una cadena homogénea de Márkov, si las probabilidades 
de transición del sisiema p; del estado i al estado j sólo dependen 
del estado í en el paso anterior y son iguales para cualquier paso. 


16 


Las probabilidades de transición pueden representarse por dos 
métodos diferentes. El primero consiste en anotar las probabilida- 
des de transición en forma de la tabla denominada matriz de tran- 
sición y designada por P. Para L=3 dicha matriz tiene el as- 
pecto; 


Pu Pe Pa 
Plos Pe Pal- (5-125) 
Pa Pa Pa 


La condición (5-108) a que están obligadas a satisfacer las 
probabilidades de transiciones significa que la suma de los ele- 
mentos de cualquier linea en la matriz de transiciones deberá ser 
sin falta igual a la unidad 


; 


z 
1 
$ 4 z 2 
5 4 á 
i 3 
3 3 


$ z 
H 
a) 

Fig. 5-9. Diagramas de transiciones para la cadena de Márkov 


El segundo método para representar las probabilidades de 
transición consiste en construir el diagrama de transiciones cuyo 
ejemplo para un sistema con tres estados se muestra en la te 
gura 5-9, a. El diagrama de transiciones constituye un grafo cuyos 
vértices corresponden a los estados del sistema y los arcos direc- 
cionales indican las transiciones posibles de un estado a otro. Las 
probabilidades de transiciones se marcan con los números atribui- 
dos a cada arco. De acuerdo con la condición (5-108) la suma de 
las probabilidades para los arcos que parten de cualquier vértice 
del grafo debe ser igual a la unidad. 

Én distintas ramas de la ciencia y la técnica muchos procesos 
pueden ser reducidos a las cadenas de Márkov. En sociología las 
cadenas de Márkov ayudan a estudiar los problemas del cambio de 
la estructura social o profesional de la población, de la migración 
de la población, etc. En biología con ayuda de las cadenas de 
Márkov se estudia la naturaleza del desarroilo de algunas especies 
de animales y plantas. En física se emplean las cadenas de Márkov 
para estudiar la difusión de los gases. En técnica con el concurso 
de las cadenas de Márkov se describen ciertos procesos de transmi- 
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sión de mensajes, diversos procesos tecnológicos, procesos de con- 
trol de la capacidad de funcionamiento y de la búsqueda de fallas 
en sistemas técnicos complejos, etc. 


Ejemplo 5-9. Una fábrica produce televisores de una marca determinada. 
Dependiendo de si el tipo dado de televisor goza o no de demanda entre el 
público, la fábrica puede encontrarse al final de cada año en uno de dos esta- 
dos: 1, hay demanda; 2, no hay demanda. Al pasar el tiempo la demanda cam- 
bia de tal modo que existe la probabilidad */, de que a finales del año la få- 
brica se quede en el estado 1. Por olra parte, si resulta que la fábrica se en- 
cuentra en el estado 2 se tomarán medidas para modificar y perfeccionar el mo- 
delo en producción, así que con la probabilidad 3/5 la fábrica pasará a finales 
del año siguiente aj estado 1. 

En el ejemplo dado el desarrollo de la producción se representa por medio 
de la cadena de Márkov con matriz de transiciones 


Dit 
5 
Pis sf 
EF 


El diagrama de transiciones se muestra en la figura 5-9, b. 


Al estudiar las cadenas de Márkov es necesario aclarar ante 
todo cómo va a variar la distribución de probabilidades de los 
estados 1, cuando el sistema adelanta un paso. Designemos por T 
el suceso que consiste en que en el paso (n +1) el sistema se 
halla en el estado j. 

En correspondencia con las designaciones convenidas la pro- 
babilidad de este suceso será igual a PT) ml} Designemos 
por S, el suceso consistente en que en el n-ésimo paso el sistema 
se halla en el estado i, de suerte que P(S) 5, Con esto, p; va 
a representar la probabilidad de que el sistema en el paso (n + 1) 
se encuentre en el estado j si el mismo se hallaba en el estado i 
en el paso n, es decir, py = P(T|S;). Por la fórmula de la pro- 
babilidad completa (5-42) hallamos: 


i 
miu = È 
A 


La fórmula (5-126) permite determinar sucesivamente, paso 
a paso, el cambio de la distribución de probabilidades de los esta- 
dos del sistema si se conoce la distribución inicial de probabilida- 
des. 

Ejemplo 5-10. Supongamos que en el momento inicial Ja fábrica del ejem- 
plo 5-9 se hatla en el estado 1. o sea, la distribución inicial de probabilidades 
tiene el aspecto sto == (1,0). Utilizando la fórmula (5-126) y la malriz de tran- 
siciones, hallamos para el primer paso 


o h, 4 
a ao + ap 1 00 


¿nl (5-126) 
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Para el segundo paso 


a" =0,76, ¿9 —=0,24. 


Continuando estos cáleulos obtenemos el 
cambio consecutivo de distribución de las pro- 
babilidades dado en la tabla 5-1 con el estado 
inicial (1,0). En esta tabla se ve que al crecer n 
la magnitud xH? se aproxima a 0,75 y la 
ad, a 0,25 

Si el estado inicial del sistema es el esta- 
do 2, o sea, a = (0,1), la distribución de pro- 
habilidades en los pasos consecutivos tendrá cl 
aspecto dado en la tubla 5-1. En este caso al 
crecer n las magnitudes ni} y w? se apro 
ximan a aquellos mismos 
que se tenían con la distri 
= (1,0), Como vemos, cadena de Márkov 
dada después de un gran número de pasos las 
probabilidades de transiciones se vuelven inde- 
pendientes del estado inicial del sistema. 


Si en una cadena de Márkov existe 
la distribución límite de las probabil 
dades correspondiente a n — œ e inde- 
pendiente del estado inicial del sistema, 
entonces esta distribución de probabili- 
dades determina el régimen límite o 
estacionario del sistema. En este caso 
el sistema se denomina estáticamente 
estable (isostático) y el proceso de Már- 
kov en dicho sistema, ergódico, 

Designemos por # =(a,..., al) 
la distribución estacionaria de las pro- 
babilidades de una cadena ergódica de 
Márkov. Las componentes 1% de esta 
distribución pueden hallarse por las 
ecuaciones (5-126) que con n —> oo ad- 
quieren la forma: 


+.» L. (5-127) 


L 
ES 2 spp j=l 
£ 


Sin embargo, no todas las L ecua- 
ciónes (5-127) son linealmente indepen- 
dientes, ya que las probabilidades a 
están asociadas entre sí por medio de 
la correlación 


(5-128) 


Tabla 5-4 


Cambio de distribución de probabilidades de los estados del proceso de Márkov 


Estado ínictal 2,=00,1) 


Estado Iniciat 14=01,0) 


1 
0,752 l 0754 | o7s | yas | o | 05 | on | 0,744 | 0,7488 | azn | Tr 


02 | 024] ozs | ozs | ozs]. ..] 1 [o4 | oz! ozss | o2512 | 0:25008 | . . 


08 | 0,76 


Por eso, para determinar las L componentes desconocidas nt 
de la distribución de probabilidades ax es suficiente tomar L — 1 
ecuaciones cualesquiera (5-127) y resolverlas junto con la ecuación 
(5-128). 


Ejemplo 5-11. Para la matriz de transiciones en el ejemplo 5-9, la primera 
de las ecuaciones (5-127) tiene la forma: 


a, 0%, E 
t a 5 5 
La ecuación (5-128) da: 
Ma 
Resolviendo conjuntamente estas ecuaciones, hallamos: 


xi=075, a =025 


Se denomina proceso transitorio el proceso de transición de la 
cadena ergódica de Márkov desde su estado inicial hasta el régi- 
men estacionario. El proceso transitorio se describe por la secuen- 
cia de distribuciones de las probabilidades nn para n = 1,2... y, 
con la distribución inicial de probabilidades dada, no puede obte- 
nerse mediante el empleo sucesivo de la fórmula (5-126) como se 
hizo en el ejemplo 5-8. No obstante, es posible proceder de otra 
manera. 

Introduzcamos en el análisis las magnitudes pj) que deter- 
minan la probabilidad de transición del sistema en / pasos del 
estado i al estado j: 


P =p (nuii) 120 ho... (5-129) 


Las probabilidades pý} hacen posible determinar la distribución 


de probabilidades m por la distribución zo según la fórmula aná- 
loga a (5-126): 


£ 
a oi 


Para establecer el vínculo de las probabilidades de transición 
pi con las probabilidades pi, hagamos [ = l + lz, considerando 
la transición del sistema del estado 7t al estado 7 en dos etapas: 
transición del estado 7o al estado xy, y después, la transición del 
estado z, al estado m =%+;- Entonces, 


(5-130) 


L 
x= Eo), 6139 
donde 


apip. (5-132) 
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Sustituyendo el vafor de x{® en (53—131), obtenemos: 
B a E. 
ai= È pi D eo E Y piep. (5-133) 
Comparando (5-133) con (5-130), hallamos que 
A 

soria $ ata 7 

pij È Pini- (5-134) 
Para calcular sucesivamente las probabilidades de transición 


pi), PS)... es conveniente hacer h = /— 1 y l= 1 en (5-134). 
Con esto obtenemos 


¿ 
= Š pi E 
PAS (6-135) 
Suponiendo consecutivamente que /= 1, 2... y teniendo en 
cuenta que según la definición de probabilidades de transición ps) 
voft tk a 
Pir 0, ik, (5-136) 
obtenemos: 
£ 
=P P= ZP + (5-137) 


La expresión (5-135) puede generalizarse para el caso de una 
cadena de Márkov no homogénea en la cual las probabilidades de 
transición dependen del número del paso. En este caso, vamos a 
entender por probabilidad p;y(n, nı) para n < n la probabilidad 
de que en el paso n; el sistema se encuentre en el estado j si en el 
paso n éste se encontraba en el estado i: 

Pul 1) =p(%, =lx,=1), n (5-138) 


Entonces, por analogia con (5-130), tenemos: 
L 
h= È nip (a, n), n<n. (5-139) 


Por otro lado, considerando cierta n’ que satisface la condición 
n< n' < m, podemos representar ai en la forma: 


L ž L 
me 2, O) È Pau (n. m) È a Pi la, n) = 


E E 
= È ria È Pa (m n) pa (a m). (5-140) 
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Comparando (5-139) con (5-140) hallamos: 
L 
Pun, n= Pista, W) pu (n, n) (5-141) 


para cualquier n < m < m, La correlación (5-141) se denomina 
ecuación de Chapman — Kolmogórov. 


5-7. ELEMENTOS DE ESTADISTICA MATEMATICA 


a) Objeto de la estadística matemática 


El desarrollo de la ciencia y la técnica exige ahondar más y 
más en la esencia de los fenómenos de la naturaleza. Sin embargo, 
los propios fenómenos de la naturaleza se alzan ante nosotros en 
forma de una enorme cantidad de hechos y observaciones variados, 
que a su vez constituyen el resultado de la acción de un conjunto 
de factores, una parte de los cuales constituye la base del fenó- 
meno considerado, y otros son secundarios, sin importancia y con 
frecuencia enmascaran sencillamente la esencia del fenómeno. Ha- 
cen falta grandes conocimientos y maestría para eliminar toda la 
información de segundo orden y revelar los datos fundamentales 
y esenciales contenidos en las observaciones. 

Los métodos de estadística matemática brindan la posibilidad 
de presentar el conjunto de resultados de la observación en una 
forma compacta y adecuada para su examen. Ellos permiten se- 
parar del conjunto de observaciones la información importante 
presentándola en forma de un pequeño número de índices de resu- 
men. Si resulta que los datos existentes son insuficientes para 
comprender la esencia del fenómeno y se requiere llevar a cabo un 
experimento adicional, los métodos de estadística matemática per- 
miten responder a la pregunta de cómo efectuar dicho experimento 
para simplificar en grado máximo el trabajo del investigador tanto 
en la realización del experimento como en la elaboración de los 
datos experimentales. 

De to dicho se infiere que la estadistica matemática es la cien- 
cia sobre los métodos para elaborar gran cantidad de datos experi- 
mentales con el fin de obtener de ellos deducciones correctas. 

En la sección dada no es posible abarcar todos los problemas 
solucionables por métodos de estadística matemática a los cuales 
está dedicada toda una serie de libros de texto y monografías. 
Por eso, sólo nos limitaremos a estudiar los métodos más difundi- 
dos para resolver los problemas estadísticos. En el capítulo 9 se 
ofrecerá el desarrollo de algunos de estos métodos realizado desde 
el punto de vista de la teoría de toma de decisiones. 
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b) Concepto de muestreo aleatorio 


Sea x una magnitud aleatoria unidimensional con la función de 
distribución de probabilidades F(x). Examinemos la magnitud 
aleatoria de n dimensiones 


W cr 0, (5-142) 


cuyas componentes separadas son magnitudes aleatorias indepen- 
dientes con iguales funciones de distribución de probabilidades 
F(x). La función de distribución de probabilidades de esta magni- 
tud multidimensional se determina como el producto de las funcio- 
nes de distribución de probabilidades de sus componentes 


Ú Fe). (6-143) 


Es cómodo considerar tas magnitudes aleatorias x® como re- 
sultados de cierto experimento. Entonces la magnitud aleatoria 
multidimensional (5-142) puede considerarse como el resultado de 
la realización consecutiva de n experimentos independientes en una 
misma instalación experimental o como resultado de n experimen- 
tos simultáneos en n instalaciones experimentales de un mismo 
tipo. 

Ya que siempre existe la posibilidad siquiera teórica de realizar 
un número ilimitado de experimentos puede hablarse de una co- 
lección infinita de números aleatorios (x() con la función de dis- 
tribución de probabilidades F(x). Esta colección infinita se de- 
nomina conjunto infinito con función de distribución de probabili- 
dades F(x). 

Cada resultado concreto del experimento, y por lo tanto, cada 
x0 de la colección finita (5-142), puede considerarse como la se- 
lección de uno de los números del conjunto infinito, La colección 
completa (5-142) representa la secuencia de n de estas muestras 
y se denomina muestreo aleatorio. 


c) Teoremas límites de la teoría 
de las probabilidades 


Presenta gran interés en la estadística matemática estudiar el 
cambio de propiedades del muestreo aleatorio al aumentar su volu- 
meri y, en particular, las correlaciones límites que se obtienen con 
n— œ. Con esto, juegan un papel principalisimo la desigualdad 
de Chébishev, la ley de los grandes números que se deriva de ella 
y el teorema central límite. 

Si x es una magnitud aleatoria con esperanza matemática v 
y dispersión o?, es válida la desigualdad siguiente llamada des- 
igualdad de Chébishev: 


PUx—vl>20)<>32. (5-144) 
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Para demostrar esta desigualdad fraccionemos el eje real en 
tres intervalos: 
l=(—%, vda; F =(v— 2o, v +o); I”=|v +20, +00). 
La dispersión de la magnitud x puede escribirse en la forma: 
to 
ds | (vwt a=|u- v w(x) dx + 


+ f (x — v? wix) dx + f (œ— v w(x) de. 
? 2 


Omitiendo en tas expresiones para g? el sumando correspon- 
diente al intervalo /”, obtenemos: 


PLS æ vw det | (œ 2 wa de. 
? ? 


Por cuanto en el intervalo / x— v<—%o y en el 7” x—v>%o0 
sólo se incrementa la desigualdad si en ambos integrales sustitui- 
mos (x — v)? por 4202. Así pues, 

PLKRIP (Ky — ho) + P x> o= 
lo que equivale a la desigualdad (5-144). 

a desigualdad (5-144) determina la probabilidad de que la 
magnitud x — v salga de los límites del intervalo (—%o, +20). No 
obstante, puede determinarse la probabilidad de que la magnitud 
x — v no salga de los límites del intervalo indicado. Esta probabi- 
lidad es igual a: 

P(Ix—-w|<20)=1—P(|x—vw!|>10), 


o tomando en cuenta la desigualdad (5-144), 


BP (| x — v | 2> A0) 


Plle=v|<201>1—=>37. (5-145) 
Si designemos Ao por e, esta desigualdad toma la forma: 

Plli—=vi<e)> 1%. (5-146) 
Vamos a referirnos al análisis del muestreo aleatorio (xi, ... 


++.,:Xn) de volumen n. Designemos por Z la media aritmética de 
este muestreo, que es igual a: 


2 Y xe (6-147) 
a 


Con el objeto de simplificar las notaciones de semejante tipo 
en lo sucesivo vamos a utilizar el símbolo S-o Sp para designar la 
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sumación de todos los datos de muestreo. En tal caso la correla- 
ción (5-147) se escribirá en la forma: 


i=7S(9= 


Se. (5-148) 
La dispersión de la magnitud % según (5-85) y (5-100) será 
igual a: 


Das [Eiso m. (5-149) 


Sustituyendo en (5-146) x por ¥ y respectivamente o? por o?/n, 
obtendremos: 
el 


donde v es la esperanza matemática ¥ que constituye el valor me- 
dio para el conjunto infinito del que se ha tomado la muestra. 

Èn la expresión (5-150) se ve que con n-o y cualquier 
e>0 


dh l<0 > 1h. 6-150) 


Pp [Ey <e}=>1, (65-151) 
lo que expresa la ley de grandes números. De ella se deduce que 
con grandes n y una probabilidad tan cercana a cero como sea 
necesaria, la media aritmética coincide con la esperanza matemá- 
tica v = M(x) de la magnitud x. 

Expongamos sin demostración una de las correlaciones límites 
más importantes de la teoría de las probabilidades que ha recibido 
el nombre de teorema central limite. Sea (Xi, ..., Xn) Una secuen- 
cia de magnitudes aleatorias que, en el caso general, tienen dife- 
rentes funciones de distribución de probabilidades Fi (x), 
los valores medios vı, . . . , Va y las dispersiones a], . 


nemos 


2=tsio vetfSim =i So 6159 


El teorema central límite afirma que si las magnitudes aleato- 
rias xı, ..., Xa son independientes y tienen dispersiones finitas de 
un mismo orden, entonces, habiendo un gran número de sumandos, 
la magnitud de la media aritmética x se aproxima a la distribución 
normal con el valor medio v y la dispersión s?. Observando que 
en este caso la magnitud 


iy 
FA; (5-153) 


tendrá valor medio nulo y dispersión unitaria, basándonos en el 
teorema central límite podemos afirmar que con n > co se cum- 
plirá la correlación 


t= 


$ 
Aen 1 Ea Ñ 
Eg S d+ Je ae baci 
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Con mucha frecuencia nos tropezamos con problemas en los 
cuales la magnitud aleatoria a analizar es la suma de un gran 
número de magnitudes aleatorias independientes. Por ejemplo, el 
error de un aparato complicado es el resultado de la acción com- 
binada de variadas condiciones exteriores y errores en algunos ele- 
mentos de este aparato. En tal caso los errores de gran influencia 
se eliminan con facilidad. 

Así pues, si ocurrió una ruptura en un circuito eléctrico, es fácil 
descubrirla y eliminar. Sin embargo, es difícil encontrar las causas 
de los errores de pequeña magnitud. Luego, puede considerarse que 
son uniformemente pequeños los sumandos separados del error 
suma y afirmarse fundándose en el teorema centra! límite, que el 
error suma va a tener una distribución próxima a la normal. 


d)Problemas de la estadística matemática 


El problema fundamental de estadística matemática es la deter- 
minación de los parámetros desconocidos de distribución del con- 
junto infinito por una muestra finita conocida. Con eso podemos 
referirnos a determinar la propia función de distribución F(x) 
o los parámetros separados de la función de distribución tales 
como el valor medio, la dispersión, el valor mínimo o máximo de 
una magnitud aleatoria, etc. 

Por cuanto los elementos de una muestra finita son magnitudes 
aleatorias, será también aleatorio el valor del parámetro determi- 
hado con ayuda de esta muestra, En particular, si tenemos varias 
muestras de igual extensión de un mismo conjunto infinito, cada 
una de ellas dará su valor del parámetro que nos interesa. Es por 
eso que mediante una muestra finita no podemos juzgar con preci- 
sión sobre el valor del parámetro y únicamente podemos estimar 
con mayor o menor exactitud este parámetro. Los valores numé- 
ricos de algunos parámetros determinados de la muestra finita se 
denominan estimaciones de los parámetros del conjunto infinito. 

En el caso general, de una misma muestra pueden obtenerse 
diferentes estimaciones, Supongamos, por ejemplo, que existe la 
muestra {Xı, X2, ..., Xn} siendo xı < x: <... < Xp Y queremos 
hallar la estimación del valor medio. En concordancia con las fór- 
mulas (3-24), (3-25) y da podemos examinar varias estimacio- 
nes de la media: la media de todas las observaciones denominada 
mediana; 


Xni para n impar; 


i= ; (5-155) 
z teni Fte gr) para n par; 
la semisuma de los valores minimo y máximo: 
=t (5-156) 
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la media aritmética de todas las observaciones: 


¿LY nm (5-157) 


izi 


¿Cuál de estas estimaciones es preferible? Puede darse res- 
puesta a esta pregunta si se introducen ciertos criterios a los que 
e satisfacer la estimación. Examinemos los más importantes de 
ellos. 

1. No desplazamiento. La estimación no debe contener error 
sistemático que aumente o disminuya el valor del parámetro para 
todas las muestras. Esto significa que la esperanza matemática de 
la estimación debe coincidir con el valor real de) parámetro, Si 

ignamos por œ el valor real del parámetro y por å, su estima- 
ón, el requisito de no desplazamiento se escribe en la forma 


M(4)=a. (5-158) 


2, Validez. La estimación â debe aproximarse a la magnitud 
del parámetro œ a medida que aumente la extensión de la muestra. 
Como que la estimación å es una magnitud aleatoria, sólo se puede 
hablar de esta aproximación en sentido probabilístico. Así pues, si 
designamos por ú, la estimación a obtenida por la muestra del 
volumen n, para una estimación válida debe cumplirse la correla- 
ción 


P(Ja,—al<ej>1 (5-159) 


para n > co y cualquier e > 0. 

3. Eficacia. De todas las estimaciones no desplazadas y válidas 
hay que preferir aquella que resulta más próxima al parámetro 
estimado, es decir, con la que, al utilizar las diferentes muestras, 
las desviaciones grandes se encuentren lo más raramente posible. 
Las estimaciones que satisfacen este requisito se denominan efica- 
ces, El requisito matemático de eficacia significa que se requiere 
la dispersión mínima de la estimación 


D(4—a)=min. (5-160) 


e) Estimaciones no desplazadas de la media 
y la dispersión 


Sea (Xi, ..., Xn) la muestra de un conjunto con el valor me- 
dio v y la dispersión g?. Designemos por ¥ la estimación para la 
media y por s?, la estimación para la dispersión. 

Habitualmente, se toma como estimación de la magnitud v el 
valor medio aritmético de la selección 


2: 


LEu=2s, 6-161) 
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Valores de límite del 95% de %Í para ta distribución Y? 


4 7lejo[o]joa 


JE JE 


0,004 | 0,103| 0,352| 0,71 1,63|2,17|2,73| 3,32 /3,94 | 46 


a 6,6 


T 
114 5,2 |” 


denominado media muestral. Como se desprende de la ley de los 
grandes números, tal estimación es válida, o sea, tiende a v cuando 
n => o. 

Por cuanto la media muestral 7 representa una suma de magni- 
tudes aleatorias, dicha media será una magnitud aleatoria. Por eso 
puede hablarse de la ley de distribución de la media muestral, de 
su valor medio y la dispersión. 

El valor medio o esperanza matemática de la media muestral 
es igual a: 


M0=LM18(0]= LS [M(9]=v. (6-162) 


Como vemos, la esperanza matemática de la media muestral 
coincide con el valor v lo que es indicio del no desplazamiento de 
la estimación (5-161). La dispersión de ta media muestral según 
(5-149) es igual a 0?%/n. 

Si la muestra está tomada del conjunto con distribución normal, 
entonces Y, como suma de las magnitudes aleatorias normalmente 
distribuidas, va_a tener una distribución normai que, tomando en 
consideración (5-162) y (5-149), tendrá la forma: 


w(3=N(», 2), (5-163) 


En muchos casos en lugar de 7 es cómodo examinar la magni- 
tud 


(5-164) 


q tiene media nula y la dispersión unitaria, cuya densidad de 
istribución de probabilidades será igual a N (0, 1). 

Si ia muestra fue tomada de un conjunto que tiene una distri- 
bución distinta de la normal, la ley de distribución de la media 
muestral también va a diferir de la normal, no obstante, basán- 
' dose en el teorema central límite, puede considerarse que con gran- 
des volúmenes de muestras esta ley será próxima a la ley 
N (v, 0*/n). 

Para encontrar la estimación no desplazada de la dispersión s? 
hallaremos la esperanza matemática de la magnitud S(x — X)2 
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Tabla 5-2 
en dependencia del número n de grados de libertad 


6 [ar [rs [19 


DpECOZHHDE 


9,4 | 10,1 | 10.9 | 11.6} 12,3| 13,1 15,41 16,2 | 16,9 47,7) 18,5 


138/14,6 
Representando esta magnitud en la forma 
S(x =P= Sj — (19 P= 

= S(x — v} — 2 (3 — v) S (x — v) +n (8 — y? 


y tomando la esperanza matemática de cada sumando, obtenemos: 


MIS — #]= in 1)0?, (5-165) 
o bien 
MEA] m0. (5-166) 


De (5-166) se deduce que puede servir de valor no desplazado 
de la dispersión la estimación de la forma 
1 


sa 


Síx— 2). (5-167) 


Para determinar la ley de distribución de la estimación de dis- 
persión examinemos previamente una importante ley de distribu- 
ción. Si y; son magnitudes aleatorias independientes que obedecen 
ala distribución normal N(0, 1), entonces la magnitud aleatoria 


r=2ñ (5-168) 


obedece a la distribución y? (ji-cuadrado) con n grados de libertad. 
En este caso el número de grados de libertad se determina por el 
número de magnitudes aleatorias independientes en la suma 
(5-168). Para la distribución y? se han compilado tablas detalladas 
en las cuales se brindan los valores de la probabilidad px) 
para los distintos n, donde y2 es un múmero positivo. cual- 
uiera. 
i La tabla 5-2 es un ejemplo de tabla similar en la que se han 
presentado los valores de x que satisiacen la condición 
P(é— %)=0,95 para n del 1 al 30. 

No es difícil ver. que si por-yi sé entiende la magnitud 
(x: — x)/0 que satisface las condiciones impuestas a ys entonces 
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la magnitud 


P 
O (65-160) 


iai 


va a definir la ley de distribución para s? 


f) Búsqueda de las estimaciones por el método 
de máxima verosimilitud 


Muchos problemas de estadística matemática se reducen a esti- 
mar cierto parámetro æ en una distribución cuyo tipo es conocido. 
Por el principio de máxima verosimilitud, como estimación del 
parámetro a se toma el valor que parezca el más probable fundán» 
dose en los datos experimentales, 

Supongamos que tenemos la muestra (xı, ..., xn) de un con- 
junto con densidad de distribución de probabilidades w(x, a), que 
depende del parámetro œ. La densidad multidimensional de distri- 
bución de probabilidades para esta muestra 


Le TI w er a) (5-170) 


se denomina función de verosimilitud. Según el principio de ma- 
xima verosimilitud, se toma como estimación del parámetro c el 
valor å con el cual la función de verosimilitud Ł o, lo que es 
igual, el logaritmo de dicha función In L alcanza el máximo. El 
valor â puede hallarse por la ecuación de verosimilitud 
dm h ðn (xp a) 

NL m0, (5-171) 


ta 


que se reduce fácilmente a la forma 


< L ðw(x 
2 wpa) g=. 61a 


Para el caso en que la muestra se ha tomado del conjunto con 
distribución normal N (v, o?) definida por (5-54), las ecuaciones 
de verosimilitud para determinar los parámetros v y ø son de la 
forma: 


È v=o; 


El 


(5-173) 


De la primera ecuación hallamos la estimación para v 


(5-174) 


que coincide con la estimación no desplazada y válida (5-161) 
obtenida antes. La segunda ecuación de verosimilitud tomando en 
cuenta (5-174) da para o? la estimación. 


LP, (5-175) 


paa 


que, sin embargo, es desplazada. Por eso, habitualmente en la 

práctica se emplea la estimación no desplazada (5-167). 
Examinemos en el ejemplo siguiente cómo se obtiene la estima- 

ción de verosimilitud máxima para la distribución exponencial. 


Ejemplo 5-12, Para determinar ej plazo medio de duración del equipo pro- 
ducido por una fábrica, se probaron n muestras (modelos) del equipo durante £ 
horas, En el transcurso de la prueba m modelos funcionaron sin fallas durante 
todo el tiempo f, y n—m modelos fallaron en los momentos ta ..., Tn=m: 
(Cuál, es la estimación más verosímil del periodo medio de funcionamiento sin 
allas: 

Suponiendo que el tiempo en el cual ocurre la falla del equipo obedece a la 
ley exponencial (5-120) de tal suerte que la magnitud tw(» t) = e" repre- 
senta la probabilidad de que el equipo se averie en el momento r y la magnitud 
eù, la probabilidad de que funcione normalmente durante el tiempo ¢, obteno- 
mos la función de verosimilitud en la forma 


s: 


nom 
L=(e3M” T] o n) 45-176) 
tat 
Con esto la ecuación (5-171) da: 
-m+ Y E y 1,)=0, (5-177) 
fai 
de donde 
m 
m+ 
taa LAA (5-178) 
De manera análoga puede mostrarse que la estimación más verosímil de Ja 
probabilidad de un suceso para el proceso de pruebas independientes, en caso de 
distribución binominal, es igual a: 
pt 45-179) 


donde n es el número de pruebas y x, el de éxitos. 

Si el proceso aleatorio obedece a la distribución de Poisson y en la muestra 
de n intervalos están contenidos r sucesos, entonces sirve de estimación más 
verosimil del número medio de sucesos en un intervalo la magnitud 


r 
=i. (5-180) 
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g) Estimación de los parámetros por el método 
de intervalos de confianza 


En las secciones precedentes se estudiaron los métodos que 
brindan la estimación del parámetro en forma de cierto número, 
o sea, de cierto punto del eje real. Tales estimaciones recibieron la 
denominación de puntuales, Por cuanto la muestra es aleatoria, en 
muchos casos, sobre todo con pequeños volúmenes de muestra, esta 
estimación puede resultar muy alejada del valor real del pará- 
metro. 

Puede proporcionar mucha más información el indicar el inter- 
valo en el cual se halla con probabilidad próxima a la unidad, el 
valor del parámetro a estimar. De esta manera, si y es una magni- 
tud próxima a la unidad, el intervalo (æn a) en el que con la 
probabilidad y se encuentra el valor del parámetro desconocido œ 


Piu <a<a)=y (5-181) 


se denomina intervalo de confianza del 100 y %. En la práctica, 
a menudo nos limitamos al examen del intervalo de confianza de 
un 95% tupon ando que y = 0,95. Si se ha hallado la estimación 
puntual del parámetro á y se conoce la densidad de distribución 
de probabilidades para esta estimación, los límites del intervalo de 
confianza se obtienen por la correlación que sigue: 

a 

| w(a)da=y. (5-182) 


a 


En diversos casos en vez de hallar el intervalo bilateral de 
confianza (œ, 2) sólo se requiere hallar el límite inferior a oel 
superior a, para el parámetro considerado æ. Los intervalos defi- 
nidos por las correlaciones 


P(a> a) =y y P(a< o) (5-183) 


se denominan intervalos unilaterales de confianza del 100 y por 
ciento. Los límites «í y a, de estos intervalos se determinan por 
las expresiones 


4% +a, 
| wíajda=y y f| wlajdi=y. (5-184) 


i 
Supongamos que la muestra del volumen n está tomada del 
conjunto con distribución normal N (v, o?) con la dispersión desco- 


nocida v y conocida o? de suerte que ¿=/n (2— v)/o. va a tener 
la distribución N(O, 1). Introduzcamos asimismo la designación 
y= l —q. En este caso el intervalo de porcentaje de confianza 
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100(1 — q) se determina mediante la correlación 


P(—u< EUO <+) i (6-185) 
o bien 
o s o 
p(z lo SH, F) t=ğ (5-186) 


Teniendo en cuenta (5-58) esta expresión puede escribirse en 
la forma 


E— q= D (ta) — D (— t) = 20 (1,), (5-187) 
lo que conduce a la siguiente correlación para determinar tq: 
DU)=F Ug). (5-188) 


Para los intervalos unilaterales de confianza (o +0) y 
(o, t) la correlación (5-187) se escribe en la forma 


| q=0(£)—0(—00)=3-+0((). (5-189) 


Con esto, para determinar los valores límites de los intervalos 
unilaterales de confianza se obtiene la correlación 


t o= — 2). (6-190) 


Como vemos, los valores límites del 100(1— g) por ciento del 
intervalo unilateral de confianza son iguales a los valores límites 
del intervalo bilateral de confianza del 100(1 — 29) por ciento. 

Haciendo q = 0,05 y utilizando las tablas de la integral de 
probabilidades de las correlaciones (5-188) y (5-190) encontramos 
los siguientes límites de los intervalos bilaterales y unilaterales de 
confianza: A 

1,=1,9; f = 1,64. (5-191) 


De este modo, la media muestral 7 calculada por la muestra del 
volumen n del conjunto con distribución normal y dispersión cono- 
cida o? hace posible afirmar con una probabilidad de 0,95 que el 
valor medio v del conjunto se determinará en el intervalo 


E 1,96 -5 <v <E La 7 (5-192) 
o que 
P a 
v> E 1,64 Je. (5-193) 
o 
v< è+ 1,64 (5-194) 


Los valores obtenidos t pueden utilizarse asimismo para bus- 
car tos intervalos de confianza con la distribución binomial 
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w(x, n, p) por cuanto dicha distribución con grandes n se apro- 
xima a la normal con el valor medio v = np y la dispersión 

= npq. Haciendo ¿=(x—np)//npg, llegamos a la conclusión de 
que si durante n pruebas independientes el suceso S ocurrió x ve- 
ces, puede afirmarse con una probabilidad de 0,95 que el valor 
medio np se hallará entre los límites siguientes: 


x— 1,96 /npg < np < x+ 1,96 /2pg. (5-195) 
o que 
np > x— 1,64 V/npg, (5-196) 
o bien . 
np < x + 1,64 y/7pq, (5-197) 


con esto, la magnitud V/npg se calcula por el valor más verosímil 


(5-198) 


Ejemplo 6-13, De la producción claborada por una fábrica se eligieron 
y probaron aleatoriamente 100 artículos entre los cuales 37 resultaron de 
segunda clase, ¿Qué puede decirse del porcentaje de artículos de segunda clase 
producidos? a e 

En el caso dado n = 100, y =37, V1pq = 4,84. Con est» 1,93 Vapg = 9,5 
de manera que x— 1,95 ynpg = 27,5 y x + 1,98 Vnpg = 46,5. 

De este modo hay 5 posibilidades de 100 de que nos equivoquemos haciendo 
una de las afirmaciones siguientes respecto al número de artículos de segunda 
clase elaborados: 

1) el mismo está comprendido entre el 27,5 y el 46,5% del número total 
de artículos; 

2) no es menor del 29% del número tota! de artículos; 

3) no es mayor del 45% del número total de artículos. 


Con gran frecuencia es necesario utilizar los intervalos de con- 
fianza para determinar la estimación v con la distribución normal 
cuando se desconoce la dispersión g?, En este caso en lugar de o? 
resulta necesario utilizar la estimación de la dispersión s2, Pero 
entonces la magnitud 


Ye”, (5-199) 


a diferencia de (5-164), ya no estará distribuida según la ley nor- 
mal. En realidad, la magnitud £ definida por (5-199) va a obedecer 
a la ley de distribución de Student, a la que puede darse la defi- 
nición siguiente. 

Sea u la magnitud aleatoria que tiene la distribución normal 
N(0, 1) y v, la que posee la distribución 32. Si u y v son indepen- 
dientes, la magnitud aleatoria 


(5-200) 
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define la distribución de Student en la 
cual la magnitud k se denomina número 
de grados de libertad. 

Si delerminamos ahora las magni- 
tudes 


E nT" 
u= YE e gme 


(6-201) 


según (5-164) y 69) éstas van a 
satisfacer las condiciones que definen la 
distribución de Student, 7 la magnitud 
t, determinada según (5- 00) coincidirá 
con el valor estipulado por (5-199) para 
k= n — 1, De este modo, la magnitud 
aleatoria t definida por la correlación 
(5-199) estará distribuida según la ley 
de Student con k = n— | grados de 
libertad. 

Designemos por fan los límites del 
intervalo bilateral de confianza del 
100(1 — q) por ciento para la distribu- 
ción de Student con k grados de liber- 
tad. Existen tablas detalladas para de- 
terminar fya con distintas q para k de 
1 a 30. Con k > 30 los valores de fon 
coinciden prácticamente con los valores 
de t4 obtenidos para la distribución nor- 
mal. El ejemplo de dicha tabla es la 
tabla 5-3 que proporciona los valores 
de tun para q = 0,05 y 0,1. 

Los límites de los intervalos unilate- 
rales de confianza tj» pueden hallarse 
por los valores fyn mediante la correla- 
ción 


ba = baw (5-202) 


Ejemplo 5-14. Para disminuir la influencia 
de las interferencias en el canal de comunica- 
ción cada resullado de la medición de cierto pa- 
rámetro v se transmite tres veces desde a bòrdo 
de un cohete a la estación de medida en tierra. 
Los resultados de las medidas son iguales a 
1=32 X=20 y x= 3,1. Determinar el 
intervalo Bilateral de confianza del 95% para el 
parámetro v considerando las distorsiones en 
cada valor transmitido independientes wnas de 
otras y destribuidas según Ja ley normal. 


Tabla 5-3 


Valores de los límites del intervalo de confianza del 100 (1— q) por ciento en dependencia del número de grados 


70 


206| 2,05] 2,04 
1,70 


7 


2 


2,09] 2,07 | 2,06 


72 


76 


2, 


1,78 


de libertad $ para la distribución de Student 


Por los datos medidos hallamos que 
nd, = Lses: 
i 


$= 


y S(x — 2)? = 0,0284. 


Pur la tabla 5-3 para q =0.05 y k£=n—1 =2, obtenemos: 
que tpa =s/Y/n =0377, 
Luego, con la probabilidad de 0,95 tenemos que 2,69 < v < 3,14 


fyg =A, a 


h) Verificación de las hipótesis estadísticas. 
Concepto de criterio de acuerdo 


Sea Z el espacio de resultados del experimento con los elemen- 
tos zÆZ. Efectuemos n experimentos para determinar la probabili- 
dad p(z) de cierto resultado 2. Si con esto el resultado z ocurrió nz 
veces, entonces estimamos la probabilidad de dicho resultado por 
la relación m/n. No obstante, en realidad la relación m/n no nos 
da la probabilidad p(z) del resultado z, sino su frecuencia q(2) 
que puede diferir considerablemente de la probabilidad, sobre todo 
con un número no muy grande de experimentos. Surge la pregunta, 
en qué medida podemos juzgar sobre la distribución de probabili- 
dades de ios resultados p(2) si conocemos las frecuencias de estos” 
resultados g(2). Sin embargo, este planteo del problema no es del 
todo correcto. 

Efectivamente, si a consecuencia del experimento se ha obte- 
nido una serie de números que expresan las frecuencias de los 
resultados aislados del experimento q (z), necesitamos determina- 
das razones para cambiarlos por otros números [probabilidades 
p(2)]. ¿Qué puede servir de fundamento para sustituir unos núme- 
ros por otros? 

upongamos que al lanzar 10 veces una moneda ésta cayó de 
escudo 7 veces. La frecuencia de caída de escudo en el experimento 
dado es de 0,7. ¿Acaso tenemos fundamento para cambiar esta 
magnitud y tomar como probabilidad de caida de escudo algún 
otro número? 

Si no sabemos nada de la moneda, en particular, si es simétrica 
o no, tampoco tenemos razón para cambiar el valor de la frecuen- 
cia obtenido del experimento. No obstante, el problema puede plan- 
tearse de otra manera. Sabemos que si la moneda es simétrica, la 
probabilidad de que caiga de escudo es igual a 0,5. Queremos com- 
probar si es simétrica la moneda y con esta finalidad la lanzamos 
10 veces. Al hacerlo, ella cae de escudo 7 veces. Nos preguntamos: 
¿tenemos o no fundamento para afirmar que la moneda es si- 
métrica? 

El problema así formulada se denomina problema de verifica- 
ción de la hipótesis, Problemas similares surgen cuando existe fun- 
damento para construir cierta hipótesis (por ejemplo, la moneda es 
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simétrica) sobre el carácter de la distribución o del valor de los 
parámetros de distribución de la magnitud aleatoria. El objetivo 
del experimento es confirmar o refutar la hipótesis propuesta. Los 
métodos de verificación estadistica de las hipótesis permiten res- 
ponder a las preguntas: 

1) ¿tiene o no el nuevo modelo de aparato calidad superior en 
comparación con los existentes? 

2) ¿va a poseer o no el sistema una probabilidad no inferior a 
la deseada? 

3) ¿va a ser o no el nuevo método de curación más eficaz que 
los existentes? etc. 

Para tener derecho a aceptar o rechazar la hipótesis conside- 
rada es necesario elaborar cierto criterio que se denomina criterio 
de acuerdo de la hipótesis verificada con los resultados del experi- 
mento, 

Supongamos que basándonos en razones cualesquiera conside- 
ramos que el valor de cierto parámetro « es igual a œp y queremos 
comprobarlo fundándonos en un experimento. Como resultado del 
experimento hallamos la estimación de este parámetro ú que, 
siendo una magnitud aleatoria, no coincide por lo general con el 
valor «o. Pero, la diferencia Au = â — a de la estimación å res- 
pecto al valor real æo no debe ser grande y, luego, no puede expli- 
carse por causas aleatorias si esta desviación resulta notable, y 
hay que estimar que la hipótesis de que el valor del parámetro es 
igual a æo no se confirma y debe ser rechazada. Asi pues, la 
elección del criterio de acuerdo significa la designación de la mag- 
nitud crítica de desviación Awer elegida de tal modo que la probabi- 
lidad de sobrepasar esta magnitud sea muy pequeña. Como magni- 
tud de la desviación crítica pueden tomarse los límites del inter- 
valo de confianza del 100(1— q) por ciento. Con esto existe la 

robabilidad q de que la desviación observada sobrepase la crítica, 
lo cual significa que será rechazada injustificadamente una hipó. 
tesis correcta. La magnitud q denominada nivel de significación 
estadística debe elegirse dependiendo de las consecuencias a las 
cuales puede llevar el rechazo de una hipótesis correcta, Práctica- 
mente, en la mayoria de los casos, se juzga posible tomar g=0,05, 
aceptando de ese modo como criterio de acuerdo un intervalo de 
confianza del 95%. No obstante, en los casos en que las consecuen- 
cias del rechazo incorrecto de la hipótesis pueden ser graves, se 
emplea q = 0,01 y a veces hasta menos. 

Debe notarse que aunque el método dado permite rechazar con 
gran seguridad las hipótesis falsas, no puede servir como demos- 
tración de la certeza de una hipótesis. Por eso, en caso de que el 
valor hipotético ay caiga dentro de los limties del intervalo de con- 
fianza, aceptamos la hipótesis no como verdadera sino como co 
cordante con los resultados del experimento, Para juzgar si la h 
pótesis es o no verdadera hay que realizar investigaciones especia- 
les, 
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PROBLEMAS PARA EL CAPITULO 5 


5-1. ¿Qué representan los sucesos Sy y Sss en el ejemplo 5-1? 

5-2 Demostrar que si el espacio de resultados del experimento contiene n 
elementos, en este espacio hay 2% sucesos diferentes. 

5-3. El almacén de una empresa recibe cortacitenitos de dos fábricas en la 
relación 1:3. La primera da un 10% y la segunda, un 20% de artículos de- 
fectuosos. Determinar, empleando la fórmula de la probabilidad total, la pro- 
babilidad de que resulte defectuoso un cortacircuito tomado al azar"del slmacén 

5-4. Construir la gráfica de la función de distribución de probabilidades 
para el número de tantos que cayeron al lanzar los dos dados de jugar del 
ejemplo 5-1 

5-5 Determinar la probabilidad de que en el ejemplo 5-5 el tiempo de 
espera del pasajero no exceda de 3 min. 

5-6. Para saber cuántos peces hay en un lago, se pescan 1000 peces, se mar- 
can y se sueltan de nuevo en el lago. ¿Con qué número de peces en el lago 
habrá la mayor probabilidad de encontrar 10 peces marcados entre los 150 peces 
atrapados nuevamente? 

5-7. Hay que horacar 100 galletas con pasas ¿Qué cantidad mínima de 
pasas hay que mezclar con la masa para que la probabilidad de que en ninguna 
de las galletas no haya ninguna pasa, no exceda de 0,01? + 


Parte segunda 


OPTIMIZACIÓN 


DE LOS PROCESOS 
DE MANDO 


Capítulo sexto 


ESTRUCTURA Y DESCRIPCIÓN 
MATEMATICA DE LOS PROBLEMAS 
DE MANDO ÓPTIMO 


6-1, RASGOS PRINCIPALES DEL PROCESO DE MANDO 


a) Concepto de mando 


Por doquier en el mundo que nos rodea (naturaleza, técnica, 
sociedad humana) transcurren diversos procesos cuyo carácter de- 
pende del conjunto de condiciones y factores que los acompañan. 
Cambiando las condiciones del transcurso de los procesos, el 
hombre puede influir en su carácter, cambiarlos y adaptarlos a sus 
objetivos. Esta intervención en la marcha natural del proceso y el 
cambio de la marcha natura! del mismo constituye la esencia del 
mando. De esta manera puede decirse que el mando representa tal 
organización de uno u otro proceso que garantice la consecución de 
delerminados objetivos. 

Para una mejor comprensión de la esencia del proceso de 
mando examinemos el ejemplo del perro que persigue a una liebre. 
Para alcanzar a la liebre el perro deberá organizar sus acciones 
de una forma determinada, gobernándolas. Por consiguiente, el 
proceso de persecusión es un proceso de mando. 

Al comienzo de la persecución debe preceder la aparición de la 
liebre, es decir, la creación de una situación durante la cual surge 
un objetivo determinado cuyo alcance es necesario o deseable. Pero 
antes de iniciar la persecución el perro debe apreciar la situación 
creada y compararla con sus deseos y posibilidades. La apreciación 
de la situación se concluye con la toma de la decisión acerca de si 
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conviene intentar alcanzar la liebre o no (ésta puede hallarse lejos 
y la persecusión es inútil, el perro puede estar agotado, ctc.). Sólo 
después que haya tomado la decisión de perseguir, el perro co- 


mienza a organizar su movimiento fijándose como objetivo alcan- 
zar a la liebre en el tiempo más breve o con el gasto mínimo de 
fuerzas. 

En cste ejemplo pueden distinguirse claramente las cuatro eta- 
pas caracteristicas de cualquier proceso de mando: la aparición del 
objetivo, la estimación de la situación, la toma de decisión y la 
ejecución de la decisión tomada. No obstante, la etapa de aparición 
del objetivo precede al comienzo del proceso de mando y la exclui- 
remos del análisis. Teniendo asimismo en cuenta que la aprecia- 
ción de la situación, al mandar procesos complejos, se realiza fun- 
dándose en la información recopilada y elaborada del modo corres- 
pondiente, llegamos a las siguientes tres etapas del proceso de 
mando: 

1) la recopilación y elaboración de la información con el obje- 
tivo de estimar la situación creada; 

2) la toma de la decisión sobre las acciones más oportunas; 

3) la ejecución de la decisión tomada. 

A veces resulta necesaria además una cuarta etapa: el control 
de la ejecución de la deci 

Los diversos tipos de problemas de mando difieren unos de otros 
por el método y la secuencia de ejecución de dichas operaciones. 


b) Tipos de problemas de mando 


Hay muchos problemas en los que los mecanismos de recopila- 
ción de la información y ejecución de la decisión tomada están ela- 
borados con tanta precisión que puede dejar de pensarse por com- 
pleto de ellos al realizar el proceso de mando. En estos problemas 
todo el análisis del proceso de mando, en esencia sólo se reduce al 
análisis de la segunda etapa. s problemas recibieron el nombre 
de problemas de toma de decisión de una etapa o de un paso. 

Sin embargo, tal enfoque constituye en la mayoría de los casos 
una idealización y simplificación del proceso real de mando. En 
realidad, todas estas etapas del proceso de mando se hallan en 
estrecha relación mutua y ta etapa de toma de decisión requiere el 
álisis más o menos detallado de los métodos posibles de realiza- 
n de la decisión tomada. Así, para tomar la decisión de renun- 
ciar a perseguir la liebre hay que convencerse de que es inútil per- 
seguirla y para ello es necesario analizar siquiera aproximada- 
mente los métodos de persecución posibles. 

A veces, en casos similares el proceso de mando se divide en 
varios pasos consecutivos, entonces la decisión tomada en cual- 
quier paso depende de los resultados de la ejecución del paso pre- 
vio. Tales procesos se denominan de pasos múltiples para la toma 
de decisión. Puede servir de ejemplo el proceso de guía de un 
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cohete al lanzarlo de la Tierra a la Luna. Aquí pueden distinguirse 
los pasos siguientes: puesta del cohete en órbita cercana a la tierra, 
organización del movimiento de éste en dirección a la Luna, paso 
del mismo a la órbita cercana a la Luna y alunizaje. 

En ejemplo dado los pasos del proceso de pasos múltiples de 
mando se obtuvieron de modo completamente natural. Sin embargo, 
en muchos casos resulta una tarea sumamente difícil el fracciona- 
miento del complejo proceso de mando en pasos con clara diferen- 
ciación de todas las etapas de mando en cada paso. Así pues, en el 
proceso de persecución de la liebre nos encontramos con una situa- 
ción continuamente en cambio, provocada por los esfuerzos de la 
liebre para escapar de la persecución. El perro deberá justipreciar 
continuamente esta situación y tomar ininterrumpidamente nuevas 
y nuevas decisiones conforme a la situación cambiable esperar 
los resultados finales de ia ejecución de las decisiones anteriores. 
En tales problemas tropezamos con procesos de mando continuos 
y dinámicos, 

En el análisis expuesto se ve cuán complejos y variados pueden 
ser los problemas de mando. Sin embargo, no estimariamos en 
grado suficiente la dificultad de resolución de estos problemas si 
no tuviéramos en cuenta la circunstancia de que los procesos de 
mando transcurren comúnmente en un medio ambiente complejo. 
En el transcurso de los procesos de mando ejercen su influencia 
diversos factores externos cuyo total a menudo se denomina 
estado de la naturaleza. Para tomar una decisión correcta sobre 
unas u otras acciones hay que estimar los resultados de estas 
acciones y para ello es necesario conocer la naturaleza de la situa- 
ción en la que se emprenden cstas acciones. 

Sin embargo, para los problemas de mando es tipico el caso en 
que la información existente es insuficiente para la estimación pre- 
cisa de la situación o está distorsionada por factores extraños. No 
obstante, la influencia de información no elimina el problema de 
tomar la decisión. La peculiaridad de los problemas consiste pro- 
cisamente en que la decisión debe tomarse sin falta independien- 
temente de si estamos en disposición de evaluar con exactitud los 
resultados a los que conducirá la decisión tomada. 

De este modo, en el proceso de mando surge la importante 
tarea de tomar la decisión en las condiciones en que la información 
sobre la situación creada es insuficiente o distorsionada. El pro- 
blema dado recibió la denominación de problema de toma de deci- 
sión en condiciones de indeterminación. 


.c) Concepto de investigación de operaciones 


Anotemos una clase especifica más de problemas de mando que 
están relacionados con las actividades de las grandes empresas 
industriales y pueden denominarse problemas de carácter organi- 
zativo y administrativo, 
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Antes de la revolución industrial podía llevar a cabo la direc- 
ción de una empresa pequeña una sola persona que hacía las com- 
pras, planeaba y orientaba el trabajo, vendia la producción, contra- 
taba y despedía a los trabajadores. Las pequeñas dimensiones de 
la empresa le permitían tomar decisiones organizativas sin acudir 
a ningún método científico basándose en sus conocimientos, expe- 
riencia a intuición. Si algunas de las decisiones tomadas no eran 
las mejores, ellas no provocaban gran daño o podían ser corregi- 
das rápidamente. 

El crecimiento de las empresas industriales hizo imposible que 
una sola persona realizara las funciones administrativas. Surgie- 
ron los dirigentes de departamentos de producción, ventas, finan- 
zas, personal, etc. La intensificación de la mecanización y automa- 
tización de la producción condujo al desmembramiento ulterior de 
las funciones administrativas. De este modo, los departamentos de 
producción resultaron divididos en grupos más pequeños que se 
ocupan de las cuestiones de explotación, reparación, contro! de ca- 
lidad, planificación, suministros, almacenaje de la producción, etc. 

Cada subdivisión especializada de una organización grande 
ejecuta una parte determinada del trabajo común guiándose por 
los objetivos generales de la empresa. No obstante, en cada subdi- 
visión especializada surgen asimismo sus objetivos propios. Todos 
eltos no siempre concuerdan y a veces provocan contradicciones de 
unos con otros. A modo de ejemplo puede examinarse el problema 
de garantizar Jas reservas de una empresa. Una subdivisión parti- 
cular puede estar interesada en aumentar considerablemente las 
reservas en depósito para asegurar la elaboración ininterrumpida 
de su produción. Pero la capacidad limitada de los lugares de de- 
pósito provoca la disminución de las reservas para otras subdivi- 
siones. Como resultado surge un problema de tipo organizativo 
y administrativo: la elaboración de una estrategia tal que sea la 
más beneficiosa para toda la empresa en cuanto a las reservas. 

Al dar solución a los problemas organizativos y administrativos 
similares es necesaría una precisa comprensión de los objetivos de 
las distintas subdivisiones y tal acuerdo entre ellos que los mismos 
no entren en contradicción unos con otros ni con los objetivos ge- 
nerales de toda la empresa. Si con esto tenemos en cuenta que la 
toma de decisiones no óptimas en las condiciones de una gran 
empresa puede provocar gran daño, se hace manifiesto que al re- 
solver los problemas de organización y administración resulta in- 
admisible fundarse sólo en la experiencia personal y el sentido 
común. Son necesarios métodos científicos. 

La joven disciplina científica que recibió el nombre de investi- 
gación operativa se ocupa de elaborar los métodos cientificos de 
resolución de problemas organizativos y administrativos. En esta 
disciplina científica se entiende por operación cierta medida orga- 
nizativa cuya realización persigue un objetivo determinado formu- 
tado con precisión, por ejemplo, la reglamentación de las reservas 
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almacenadas en un depósito. Deben presentarse las condiciones que 
caracterizan la situación en que se ejecutan las medidas, en parti- 
cular, las necesidades de reservas y las limitaciones en locales de 
depósito en el ejemplo considerado. El objetivo de la investigación 
operativa es hallar y fundamentar cientificamente aquellos méto- 
dos de realización de la medida que sean los más ventajosos en 
cierto sentido. 

La particularidad específica de las tareas de tipo organizativo 
y administrativo consiste en que las consecuencias de su resolu- 
ción por uno u otro método pueden reflejarse considerablemente en 
el trabajo de toda la empresa. Por eso la toma de la decisión defi- 
nitiva siempre queda a la competencia de la persona responsable, 
el administrador, investido de los derechos correspondientes, y sale 
de los marcos de la investigación operativa. La investigación opc- 
rativa sólo persigue el objetivo de poner en manos del administra- 
dor recomendaciones fundamentales para tomar la decisión. 

De esta manera, la investigación operativa constituye la co- 
rriente cientifica cuyo objetivo es la elaboración de métodos de 
análisis de las acciones dirígidas a una finalidad (operaciones) 
y la estimación comparativa objetiva de las decisiones posibles. 
Aunque la investigación de operaciones constituye una corriente 
cientifica independiente que surgió en los años de la Segunda 
Guerra Mundial durante la resolución de los problemas de defensa 
antiaérea en Inglaterra (es decir, cronológicamente antes de la 
aparición de la cibernética), no obstante, durante la solución de 
algunos problemas ella aplica ampliamente los métodos de esta 
última. 


6-2. OPTIMIZACION DEL PROCESO DE MANDO 


a) Criterio de calidad de mando 


En lo sucesivo vamos a considerar el problema del mando como 
un problema matemático. Sin embargo, a diferencia de otros 
muchos problemas matemáticos, éste posee la peculiaridad de que 
no admite una solución sino un conjunto de soluciones diferentes. 
Esto se debe a que en los problemas de mando, por lo general, 
existen muchos métodos de organización de algún proceso que con- 
ducen a alcanzar el objetivo planteado. Así, durante el proceso de 
persecusión de la liebre el perro puede organizar de diferente modo 
el carácter de su movimiento, durante el lanzamiento de un cohete 
a la Luna pueden elegirse distintas trayectorias para el vuelo del 
mismo, etc. Por eso, el problema del mando se podría plantear 
como el problema de buscar siquiera uno de los métodos posibles 
para lograr el objetivo impuesto. No obstante, tal planteo de la 
cuestión es, por lo común, insuficiente. 
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Si existe un conjunto de soluciones de cualquier problema, 
surge un problema adicional: elegir de este conjunto de soluciones 
aquella que sea la mejor desde cierto punto de vista. Pueden pre- 
sentarse muchos ejemplos de estos problemas. Así pues, hay mu- 
chos métodos para pegar una caja formada de una Roja de cartón 
de dimensiones dadas. Puede considerarse como el problema adi- 
cional la obtención de la caja de máxima capacidad. Es posible 
viajar de una ciudad a otra utilizando diversos medios de trans- 
porte: aéreo, acuático, por ferrocarril, autobús y automóvil. Puede 
considerarse como una tarea complementaria la elección del medio 
de transporte más ventajoso desde el punto de vista del tiempo de 
viaje, el costo, la comodidad, las costumbres, etc. En los problemas 
de mando hay una situación análoga. 

En los casos en que el objetivo del mando puede lograrse por 
varios métodos diferentes es posible plantear requerimientos cspe- 
ciales al método de mando, el grado de cumplimiento de los cuales 
puede servir de fundamento para dar preferencia a un método de 
mando sobre todos los demás. 

En muchos casos la realización del proceso de mando requiere 
el gasto de algunos recursos: gasto de tiempo, consumo de mate- 
riales, combustible, energía eléctrica. Luego, al elegir el método 
hay que pensar no solamente si se consigue el objetivo planteado, 
sino también qué recursos hay que gastar para lograr dicho obje- 
tivo. En este caso el problema de mando consiste en elegir del 
conjunto de soluciones que garanticen la consecución del objetivo, 
la solución que requiera el gasto mínimo de recursos. 

En otros casos pueden servir de fundamento para preferir un 
método de mando a un otro diferentes requerimientos impuestos al 
sistema de mando; el costo de entretenimiento, la fiabilidad, el 
grado de cercanía del estado obtenido del sistema al requerido, el 
prado de certeza de los conocimientos sobre el estado de la natura- 
eza, ete. 

La expresión matemática que brinda una estimación cuantita- 
tiva del grado de cumplimiento de las exigencias impuestas al 
método de mando se denomina criterio de calidad de mando. El 
método de mando preferible u óptimo será aquel con el cual el cri- 
terio de calidad de mando alcanza su valor minimo (a veces, má- 
ximo). Al elegir, por ejemplo, el régimen de vuelo puede tomarse 
como criterio de calidad de mando la expresión para la cantidad 
de combustible consumido en la unidad de espacio, o el espacio 
recorrido con la unidad de combustible. Al régimen más económico, 
o sea, óptimo, va a corresponder el valor mínimo (en el primer 
ca) o máximo (en el segundo caso) del criterio de calidad de 
mando, 

Vamos a considerar como preliminar la definición de mando 
óptimo expuesta. Una definición más rigurosa se dará después del 
análisis de las limitaciones impuestas al proceso de mando. 
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b) Limitaciones impuestas al proceso de mando 


El problema de la búsqueda del mando óptimo o del mando en 
general, debe considerarse inexistente, es decir, incapaz de motivar 
problemas algunos si no se han aplicado ningunas limitaciones al 
carácter del movimiento del sistema. Así, el problema de persecu- 
ción de la liebre no existiría en lo absoluto si el perro pudiera sal- 
var instantáneamente la distancia que lo separa de la liebre. Por 
consiguiente, al resolver un problema de mando no podemos dejar 
de tener en cuenta la circunstancia de que el movimiento de cual- 
quier sistema siempre está sometido a limitaciones de diverso gê- 
nero. 

Para representarnos más claramente las limitaciones que se 
manifiestan, examinemos el ejemplo concreto de conducir un auto- 
móvil. Efectuando el proceso de condución el chófer debe tomar 
en consideración que el automóvil tiene un motor de limitada po- 
tencia, es decir, sólo puede llevar un peso limitado con una veloci- 
dad máxima limitada. Gracias a la inercia, la velocidad del auto- 
móvil y la dirección de su movimiento pueden variar sólo con una 
aceleración de valor limitado. Esto significa que no es posible la 
detención o el cambio instantáneos de la dirección del movimiento 
en caso de surgir una situación peligrosa inesperada lo que a su 
vez limita la velocidad de movimiento. El chófer, al elegir la ruta, 
se ve obligado a tener en cuenta la reserva limitada de combus- 
tible en el tanque, la necesidad de reabastecerse de aquél en el 
camino, etc. 

En el caso general hay dos tipos de limitaciones en la elección 
del método de mando. Las limitaciones del primer tipo son las pro- 
pias leyes de la naturaleza en concordancia con las cuales ocurre 
el movimiento del sistema controlado, Al enunciar matemática- 
mente el problema del mando estas limitaciones se representan 
corrientemente por ecuaciones algebraicas, diferenciales o de dife- 
rencia, del objeto controlado y éstas se llaman, a menudo, ecuacio- 
nes de enlace, El segundo tipo de limitaciones es debido a la 
restricción de los recursos empleados durante el mando o de otras 
magnitudes, las cuales, a causa de las particularidades físicas de 
uno u otro sistema, no pueden o no deben sobrepasar de ciertos 
límites. Las limitaciones matemáticas de este tipo se expresan ha- 
bitualmente en forma de sistemas de ecuaciones o desigualdades 
algebraicas las cuales se vinculan las variables que describen el 
estado del sistema. 


c) Enunciado del problema del mando óptimo 


El problema del mando puede considerarse enunciado matemá- 
ticamente si: 

está enunciado el objetivo del mando expresado por medio del 
criterio de la calidad de mando; 
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están definidas las limitaciones del primer tipo que representan 
un sistema de ecuaciones diferenciales o de diferencias, las cuales 
limitan Jos modos posibles de movimiento del sistema; 

están definidas las limitaciones del segundo tipo que represen- 
tan un sistema de ecuaciones o desigualdades algebraicas que ex- 
presan la restricción de los recursos o de otras magnitudes utili- 
zadas durante el mando. 

Se denomina mando óptimo al método que satisface todas las 
limitaciones planteadas y transforme en mínimo (máximo) el cri- 
terio de la calidad de mando. 


6-3. DESCRIPCION MATEMATICA DEL OBJETO 
CONTROLADO 


a) Estructura del objeto controlado 


Denominemos objeto controlado aquel sistema físico cuyos pro- 
cesos mandamos. Los objetos controlados pueden ser muy variados 
y tener la más diversa naluraleza física. A saber: 

dispositivos técnicos: automóvil, avión, cohete, torno, proceso 
tecnológico, etc.; 

empresas industriales: departamento, taller, fábrica, rama in- 
dustrial; 

sistemas económicos: economía de la empresa, economía de la 
rama industrial, economía del estado; 

sistemas biológicos; 

sistemas sociales, etc. 

La circunstancia de que las leyes a las cuales obedecen los 
procesos de mando son comunes a los objetos controlados de cual- 
ques naturaleza física, permite estudiar la estructura general y 

lar una descripción matemática general del proceso de mando. 

Designemos por x la variable que determina el estado del 
objeto controlado. A veces ésta constituye una magnitud unidimen- 
sional o escalar. Ella puede ser: el ángulo de rotación del árbol 
de un motor, la velocidad de un avión o cohete, la presión del va- 
por en la caldera de una máquina de vapor, el número de objetos en 
un depósito, el número de aviones con base en un aeródromo, etc. 

No obstante, en la mayoría de los casos para describir el objeto 
controlado se requiere no una sola sino varias variables xı, ..., Xy. 

Al describir Tos sistemas mecánicos las magnitudes x; repre- 
sentan las coordenadas o velocidades de las piezas móviles; 

en los sistemas eléctricos las magnitudes x; serán las intensi- 
dades de las corrientes o los valores de las tensiones; 

en la economía ellas pueden ser las capacidades de producción 
o los recursos de algunas ramas industriales; 

en un sistema biológico las magnitudes x; pueden caracterizar 
la concentración de substancias químicas o medicinas en diversos 
órganos. 
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En todos los casos examinados el estado del objeto controlado 
va a describirse por una variable multidimensional, es decir, vecto- 
rial x cuyas componentes serán las magnitudes xs; 


x= (Xp, -e Xy). (6-1) 

En lo sucesivo denominaremos a la variable x variable o vec- 
tor de estado del objeto controlado. 

Las magnitudes x; pueden variar continuamente en cierto iu- 
tervalo de valores o tomar un conjunto finito de valores. En este 
último caso la magnitud x va a tomar también un conjunto finito 
de valores y vamos a designar su valor k por 

Am (A Y k=l,’ (6-2) 


Entonces el conjunto 


X=(4,.... 0) (6-3) 


va a representar el espacio de estados posibles del objeto contro- 
lado. A veces llamaremos al espacio X espacio de soluciones, su- 
brayando así que la elección de cierta x & X constituye una solu- 
ción poábla del problema de mando. 

Sí las magnitudes x; pueden variar continuamente, es decir, 
toman un conjunto infinito de valores, el espacio de estados posi- 
bles del sistema X será un conjunto infinito. Pero tampoco en este 
caso los valores de x; pueden ser, por lo común, cualesquiera. Pue- 
den aplicarse a ellos limitaciones que, como ya se indicó, tienen ha- 
bitualmente la forma de sistemas de ecuaciones o desigualdades 
algebraicas 

Pin Y AS, 290, i=l, me (6-4) 


En cada una de las limitaciones (6-4) se conserva sólo uno de 
los signos <, = ó =, no obstante, las distintas limitaciones pue- 
den tener asimismo distintos signos. Las magnitudes m y no 
están vinculadas entre sí, de modo que m puede ser mayor, menor 
o igual a N. En particular, m puede ser igual a cero, así, no se 
excluye el caso en que falten las limitaciones (6-4). Frecuente- 
mente algunas o todas las variables x; satisfacen la condición de 


no negatividad 
a4>0 i=b.... N. (6-5) 


La condición de no negatividad de las variables resulta muy 
cómoda en caso de dar solución numérica a las ecuaciones que 
describen el proceso de mando. Además, en muchos problemas, por 
ejemplo, los económicos, las magnitudes x; no pueden ser negati- 
yas por su sentido físico (gastos, volumen de producción, cantida- 
des de imercancías transportadas, sumas de dinero distribuidas de 
diversa manera, etc.). Sin embargo, Jos problemas en los cuales 
las variables pueden ser de signo arbitrario, es decir, satisfacen 
las limitaciones del tipo 


azu, i= 


2era N, (6-6) 
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donde a, son números arbitrarios que se transiorman fácilmente en 
problemas con variables no negativas introduciendo nuevas va- 
riables: 

n= an, i=l,..., N. (6-7) 


A la par con la variable x la cual vamos a considerar en lo 
adelante capaz de ser medida y controlada, el estado del objeto 
controlado puede depender de un conjunto de factores no contro- 
Tables o controlables no por completo que se determinan por un 
conjunto de condiciones exteriores en las que se encuentra el objeto 
controlado. Por ejemplo, el piloto puede regular el régimen del 
avión cambiando la altura y velocidad de vuelo que son los pará- 
metros controlados en el caso dado. Sin embargo, influyen en no- 
table grado en el consumo de combustible las condiciones atmosfé- 
ricas que el piloto puede tomar en consideración sólo parcialmente 
pero sobre las cuales él no puede influir activamente ni siquiera 
preverlas con exactitud, 

Vamos a denominar estado de la naturaleza designándolo por 
0 el total de factores exteriores no controlables que ejercen in- 
fluencia sobre el proceso de mando. En muchos casos mediante 
cierta idealización de los fenómenos reales se logra reducir toda 
la variedad infinita de condiciones exteriores a un número finito 
de estados posibles de la naturaleza 00, ..., 0%, o sea, introducir 
en el análisis el conjunto finito 


e=f0",.... 0, (6-8) 


que se denominará en lo adelante espacio de estados de la natura- 
leza. Los elementos 0% del conjunto 8 son en el caso general mag- 
nitudes multidimensionales 


A O i=, ae L (6-9) 


La imposibilidad de controlar completamente todos los factores 
externos provoca que en lugar de conocer con exactitud el estado 
de la naturaleza Ú en muchos casos nos vemos obligados a limi- 
tarnos solamente a conocer las probabilidades £(0) de los diferen- 
tes estados de la naturaleza 0 E O. 

Vamos a denominar probabilidades apriorísticas de los estados 
de la naturaleza a las probabilidades £(0) obtenidas de uno u otro 
modo para todas las 40. Naturalmente, las probabilidades 
apriorísticas (0) que representan la distribución de probabilida- 
des en el espacio O deben satisfacer las condiciones (5-4). 

En diversos casos es necesario considerar el estado de la na- 
turaleza 0 como una magnitud aleatoria continua para la cual el 
espacio de estados de la naturaleza O representa un conjunto infi- 
nito. En estos casos la distribución de las probabilidades E(0) se 
convierte en la densidad de distribución de probabilidades. 

Para describir la acción encaminada a una finalidad que se 
ejerce sobre el objeto controlado introduciremos la variable u que 
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vamos a denominar acción de mando o simplemente mando. Asi 
pues, el término mando se utilizará en lo sucesivo en dos sentidos: 

1) el mando como actividad organizativa dirigida a conseguir 
determinados objetivos; 

2) el mando en el sentido de acción de mando, es decir, de 
cierta magnitud física cuyo cambio se efectúa según nuestros de- 
seos y que influye sobre el carácter de los procesos en el objeto 
controlado cambiándolos en la dirección necesaria. 

El sentido concreto en el cual se utiliza la palabra “mando” 
en los diferentes casos se aclara habitualmente por el contexto. 

Durante el mando de objetos complejos es necesario utilizar, 
por lo común, varias acciones de mando u, ..., tn, de suerte que 
el mando u representa en el caso general la magnitud multidimen- 
sional 


u=(U, -... Un) (6-10) 

Así pues, el piloto puede cambiar el régimen de vuelo em- 
pleando el mando u que consiste en la acción sobre la cantidad de 
combustible consumido (41) y la acción sobre el timón de al- 
tura (49). 

En los sistemas reales no pueden ser tomadas acciones de 
mando u; cualesquiera sino que ellas están sometidas a limitacio- 
nes de distinto género. Designemos por U el conjunto de todos 
los valores de los mandos u que satisfacen las limitaciones im- 

uestas. Entonces cualquier u E U será un mando admisible, En 
los sucesivo van a encontrarse a menudo problemas en Jos que el 
conjunto de mandos admisibles U es el conjunto finito 


U= {uh aa, 400). (6-11) 


Puede juzgarse sobre cómo el mando empleado u garantiza la 
consecución de los objetivos planteados por los valores de las va- 
riables de estado x. Sin embargo, en muchos casos esto resulta 
inconveniente ya que los objetivos del mando pueden expresarse 
por medio de las variables de estado de un mando bastante com: 
plicado. Por eso a la par con las variables de estado x conviene in- 
troducir en el análisis las variables de salida q que expresan en 
forma explicita los objetivos del mando. 

A veces, en calidad de variables de salida puede utilizarse al- 
guna de las variables de estado. Pero en el caso general esto no 
es así. Por ejemplo, al mandar el régimen de vuelo con la finali- 
dad de minimizar el consumo de combustible en la ruta establecida 
es conveniente tomar como variable de salida el espacio recorrido 

or unidad de combustibie, mientras que serán variables de estado 
a velocidad y altura del avión. Pueden ser variables de salida no 
sólo magnitudes fisicas sino indices económicos, por ejemplo, el 
rendimiento, etc. En particular, el criterio de la calidad de mando 
también puede considerarse como variable de salida. 
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La variable de salida g depende en primer lugar del estado del 
objeto controlado x. No obstante, pueden ejercer influencia sobre 
ella el mando utilizado u y los factores exteriores no controlables 0. 
Por consiguiente, la ecuación para la variable de salida en el caso 
general tiene el aspecto: 

q=Q(1x, u, 0). (6-12) 

Puede ¡lustrarse la acción recíproca de todas las variables exa- 
minadas más arriba, en forma del esquema estructural del objeto 
controlado mostrado en la figura 6-1. 


to 
controlado 


Fig. 0-1. Esquema estructural del objeto controlado 


b) Ecuaciones de movimiento del objeto controlado 


Bajo la acción de las señales de mando u el objeto controlado 
cambia su estado. El carácter de los procesos que ocurren se de- 
termina por la velocidad de cambio de la variable de estado del 
objeto % = dx/dt la que representa en conformidad con (6-1) la 
magnitud multidimensional 

EN (6-13) 
donde ki, ..., kw son las velocidades de cambio de las componen- 
tes de la variable multidimensional x. 

Para los sistemas dinámicos en los cuales los procesos físicos 
transcurren continuamente en el tiempo, las velocidades x, en 
algún momento dependen del estado del objeto controlado en el 
mismo momento el que a su vez se determina por los valores de la 
variable de estado x, el estado de la naturaleza 0 y el mando em- 
pleado u. Esta dependencia puede escribirse en forma del sistema 
de ecuaciones diferenciales corrientes 


= gi'x, u, 0), x(0)=c, ¿=1,..., N, (6-14) 


donde las magnitudes c(i= 1, ..., N) caracterizan el estado ini- 
cial del objeto controlado. 

A veces resulta cómodo utilizar las notaciones vectoriales y re- 
emplazar el sistema (6-14) por una ecuación 


i=g(x, 4,0) x(0= (6-15) 
Aqui c = (C1, ..., €x) sobreentendiéndose por g la función vec- 


torial 
E= (gn e Ex). (6-16) 
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La introducción de la variable $ en calidad de argumento en 
la ecuación (6-15) en diversos casos resulta inconveniente ya que 
en el proceso de mando el estado de la naturaleza se mantiene por 
lo común invariable. Sin embargo, para distintos procesos de 
mando el estado de la naturaleza puede ser diferente lo que se ma- 
nifiesta en el cambio de aspecto de la ecuación de movimiento. Es 
más cómodo señalar la dependencia del aspecto de la ecuación con 
relación al estado de la naturaleza sencillamente con el subíndice 
en la función g escribiéndose la ecuación (6-15) como 


i= glu, x) x(0) =c. (6-17) 


Si el estado de la naturaleza no cambia en el transcurso de 
todos los procesos de mando examinados entonces puede no seña- 
Jarse el subíndice Y. 


6-4, CLASIFICACION DE LOS PROBLEMAS 
DE MANDO OPTIMO 


a) Problemas de toma de decisión de un paso 


En los problemas de un paso habitualmente no se estudian los 
métodos de realización de la decisión tomada, es decir, no se de- 
terminan la magnitud ni el carácter de la acción de mando u, sino 
directamente el valor de la variable de estado del sistema x cuyo 
valor pos Gl la mejor consecución del objetivo del mando. 

El problema de toma de decisión de un paso se considera plan- 
teado si están dados el espacio de estados de la naturaleza © con 
la distribución de probabilidades £(0) para todas las 9 Œ ©, el 
espacio de decisiones X y el criterio de calidad de la decisión to- 
mada que para este caso vamos a denominar función de objetivo. 
En la literatura en lugar del término “función de objetivo” se 
emplea también la denominación “función de ganancias” o “fun- 
ción de pérdidas”. La función de objetivo que expone de modo 
explícito los objetivos del mando puede considerarse como la mag- 
nitud de salida del objeto controlado y designarse por q. La fun- 
ción de objetivo constituye una magnitud escalar que depende del 
estado de la naturaleza Y y del estado del objeto controlado x 
pudiendo escribirse por analogía con (6-12) en la forma 


q=Q(x, 0) (6-18) 


Como vemos, el problema de toma de decisiones de un paso re- 
presenta la tríada 


G= (X, 9, q), (6-19) 


donde q es la función escalar definida en el producto directo de tos 
conjuntos Y X ©. La solución de este problema consiste en hallar 
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una x* E X tal que reduzca al minimo la función q, es decis, satis- 
faga la condición 
L= {rE X: Qix, 0)= mín) (6-20) 


Notemos que si hay la tarea de no minimizar sino de maximizar 
la función q, ésta no provocará ningunas dificultades adicionales 
ya que si para x = x* la función Q(x, 0) alcanza un máximo, para 
la misma x la función —Q (x, 0) va a alcanzar un mínimo. 

Existen diferentes métodos de resolución del problema de toma 
de decisión de un paso. La posibilidad de aplicar uno u otro mé- 
todo depende del modo de presentación del conjunto de las solucio- 
nes admisibles X, de la información existente sobre el estado de la 
naturaleza y del lipo de función de objetivo q. Daremos una ca- 
racterística breve de los principales de estos métodos. 

El problema se llama determinado si no hay indeterminación 
en cuanto al estado de la naturaleza. En los problemas determi- 
nados el espacio de estados de la naturaleza © consta, por todo, 
de un solo elemento o, cuya probabilidad es igual a la unidad. En 
este caso la función de objetivo sólo dependerá del estado del 


objeto controlado 
9=Q(0%, x)= q(t --.. Xy). (6-21) 


El problema determinado de un paso se denomina problema 
clásico de optimización si en ella tienen lugar limitaciones del 
tipo (6-4); por cierto, entre estas limitaciones no hay desieualdas- 
des, no hay condiciones de no negatividad o discresión de las va- 
riables, m<N y las funciones fi (Xi, ..., Xx) y q(x) = 
= q (xı, ..., Xx) son continuas que tienen derivadas parciales por 
lo menos de segundo orden. En este caso el problema se formula 
del modo siguiente. Están dadas las limitaciones del tipo 

Filt <e., Ep), dl, aa m. (6-22) 

Hallar los valores xı, ..., xy que satisfagan las ecuaciones 
(6-22) y que minimicen la función g (Xp, ..., Xx)» 

La peculiaridad de estos problemas consiste en que ellos, al 
menos en principio, pueden resolverse por métodos clásicos basa- 
dos en el empleo del cálculo diferencial. Efectivamente, las ecua- 
ciones (6-22) permiten dejar de considerar m variables. Con esto 
la función de objetivo se reduce a la forma 


Ali =D <<, Yodo (6-23) 
donde se designan por yt, ..., Yum las variables no excluidas. 
Ahora el problema consiste en encontrar los valores yı, ..., Y, 


que reducen al mínimo la función q, y a los cuales no se han ap 
cado ningunas limitaciones. Esta solución puede hallarse por el 
sistema de ecuaciones que se obtienen igualando a cero las deri- 
vadas parciales de la función q,: 

day 


JES id. NM, (6-24) 
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Pero, en este camino se encuentran de ordinario tales dificul- 
tades de cálculo que hacen imposible la búsqueda de otros méto- 
dos de resolución. 

En los últimos años se nota un extraordinario interés hacia los 
métodos de resolución def problema de un paso, que han recibido 
el nombre de programación matemática. Estos mélodos ofrecen la 
posibilidad de hallar los valores de las variables xı, ..., xy que 
obedecen a limitaciones del tipo (6-4) tanto en forma de igualda- 
des como de desigualdades y minimizan la función de objetivo 
Q(X, ..., Xy). Por lo general, a las variables se imponen las 
condiciones adicionales de que sus valores no sean negativos. 
Es necesario recalcar que la programación matemática no es una 
forma analitica sino algoritmica de resolver el problema, o sca, no 
proporciona una fórmula que exprese el resultado definitivo sino 
sólo indica el procedimiento de cálculo que conduce a la solución 
del problema. Por eso, los métodos de programación matemática 
se vuelven efectivos principalmente en caso en que se utilicen cal- 
culadoras numéricas, (digitales). 

El caso más sencillo del problema de programación matemática 
es el de programación lineal. Este corresponde al caso en que los 
primeros miembros de las limitaciones (6-4) y la función de obje- 
tivo (6-21) representan funciones lineales de xi, ..., Xw. En el pro- 
blema de programación lineal se requiere hallar valores no nega- 
tivos de las variables xı, ..., Xy los cuales reducen al mínimo la 
función de objetivo 


(Xi, <.., Xy) (6-25) 
y satisfacen el sistema de limitaciones 
Y 
A ayy K0, ¿ay Y (6-26) 


Cualquier problema de programación matemática que difiera 
del enunciado se denomina problema de programación no lineal. 
En los problemas de programación no lineal sea la función de obje- 
tivo (6-21), sean los primeros miembros de las limitaciones (6-4), 
o bien, la primera y los segundos son funciones no lineales de 
Xt» +.» , Xu. No obstante, se considera asimismo problema de pro- 

ramación no lineal el problema en que la función de objetivo y las 
imitaciones tienen el aspecto (8-25) y (6-26), pero se presupone, 
por ejemplo, que las variables sean números enteros. Este último 
problema se denominó problema de programación de números en- 
teros. 

Los problemas de programación no lineal son considerable- 
mente más complejos que los de programación lineal y en la ac- 
tualidad sólo se han elaborado procedimientos de cálculo para 
algunos tipos de estos problemas. Más adelante examinaremos de», 
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talladamente los métodos de resolución de problemas de programa- 
ción lineal. Los métodos de resolución de problemas de programa- 
ción no lineal se estudian en otros libros al efecto. 

El problema de toma de decisión de un paso se denomina esto- 
cástico si el espacio de estados de la naturaleza O consta de más 
de un elemento, de modo que se conoce no el estado real de la 
naturaleza 0, sino la distribución de probabilidades (0) en el es- 
pacio ©. 

Los problemas estocásticos que requieren hallar los valores de 
las variables que satisfacen las limitaciones (6-4) y minimizan la 
función de objetivo (6-18) se denominan problemas de programa- 
ción estocástica. No obstante, en muchos casos por medio de una 
definición, algo distinta de la función de objetivo, los problemas de 
programación estocástica pueden reducrise a los problemas de 
programación lineal o no lineal. En efecto, como que el estado de 
la naturaleza 0 es una magnitud aleatoria con distribución de pro- 
babilidades E(0) en el espacio O, el valor Q(0, x), dado x = 

= (Xy, Xy) será también una magnitud aleatoria con la misma 
distribución de probabilidades £(0) en el espacio O. Por eso en el 
caso dado es conveniente tomar como función de objetivo el valor 
medio de la función Q (9, x} en el espacio ©. 

De esta manera, para los problemas estocásticos la función de 
objetivo según (5-64) puede ser determinada por la expresión 


a= E $(0,Q(0, x). (6-27) 
oTo 


Por cuanto q,(x) es una función determinada de x, el problema 
de hallar las variables x, , Xy que satisfacen las limitaciones 
(6-4) y minimizan la función objetiva (6-27) puede resolverse por 
los métodos de programación lineal o no lineal. 

Un caso importante de problema estocástico de toma de deci- 
sión de un paso es el caso en que las magnitudes xX 
X(i=1,..., N) pueden tomar solamente un conjunto finito de 
valores, es decir, las limitaciones para los valores de las variables 
están dadas en forma del espacio de decisiones X definido por la 
correlación (6-3). Se ocupa de los métodos para resolver estos 
problemas la rama de las matemáticas que ha sido denominada 
teoria de las decisiones estadisticas. 

En la actualidad se presta gran atención a los problemas en 
los que la solución se toma no por un individuo sino por varios 
(por ejemplo, por dos), siendo contradictorios los intereses de 
éstos. Puede servir de ejemplo el problema de persecución en el 
que la distancia entre el persecutor y el perseguido depende de las 

ecisiones y acciones de ambos. En este caso el persecutor está 
interesado en disminuir máximamente esta distancia y el perse- 
guido, en hacerla lo mayor posible. Estos problemas recibieron la 
denominación de situaciones de conflicto y los métodos de su re- 
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solución se estudian en la teoría de los juegos. Las personas que 
toman las decisiones se Haman jugadores. 

Por cuanto en una situación de conflicto cada uno de los juga- 
dores toma decisiones independientemente de las decisiones toma- 
das por el otro jugador, al descubrir matemáticamente la situación 
de conflicto el espacio de decisiones debe considerarse como el pro- 
ducto directo de dos conjuntos 


XXY, (6-28) 


donde X = (x; » Xa} es el espacio de soluciones del primer 
jugador e Y = (Y, ..., Ym} el espacio de soluciones del segundo 
jugador. 

Los elementos del espacio de decisiones X X Y van a represen- 
tar pares del tipo (x, y), x € X, y Y, o sea, van a determinarse 
por las decisiones tomadas tanto por el primer jugador, como por 
el segundo. Para más sencillez vamos a considerar que no existe 
indeterminación en el estado de la naturaleza, Entonces la función 
de objetivo dependerá solamente de los elementos del espacio X X Y 


y tendrá el aspecto 
q=Q(x y). (6-29) 


La contraposición de los intereses de los jugadores consiste en 
que el primer jugador que hace la elección de entre el conjunto X, 
trata de minimizar con su elección la función de objetivo, mientras 
que el segundo jugador, que hace la elección de entre el conjunto Y 
tiende a maximizarla. De esta suerte, la esencia de la situación de 
conflicto consiste en que cada jugador debe tomar la mejor deci- 
sión desde su punto de vista, teniendo en cuenta que su adversario 
hace lo mismo. 


b) Problemas dinámicos de optimización de mando 


Entre los diversos problemas de cibernética ocupan un lugar de 
importancia aquellos en que el objeto controlado se encuentra en 
estado de movimiento y cambio continuos bajo la influencia de 
diversos factores externos e internos. Los problemas de mando de 
tales objetos pertenecen a la clase de los problemas dinámicos de 
mando. 

El objeto se denomina controlable si entre los diferentes fac- 
tores que obran sobre él existen tales que disponiendo de ellos 
puede cambiarse la naturaleza de su movimiento. Como ya se in- 
dicó, tales acciones encaminadas a una finalidad se denominan 
mandos y se designan por u(t). 

El carácter de movimiento del objeto controlado se determina 
por el sistema de ecuaciones diferenciales (6-14) que es cómodo 
escribir abreviadamente al estilo vectorial en forma de una ecua- 
ción diferencial (6-17). El mando u(£) forma parte del mando 
(6-17), de modo que esta ecuación determina no sólo el movi- 
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miento concreto del objeto sino sus posibilidadas técnicas que pue- 
den ser realizadas mediante el empleo de uno u otro mando del 
espacio de mandos admisibles U. 

Como antes, puede evajuarse en qué grado se logran con uno 
u otro método de mando los objetivos planteados introduciendo la 
función de objetivo del tipo (6-12), que en el caso dado es conve- 
niente escribir en la forma 

4=Qo[x(0), u(i. (6-30) 

Así pues, si (1) es el consumo instantáneo de combustible y 
x(t), la velocidad instantánea de un avión, desde el punto de vista 
del consumo de combustible, la calidad de mando en cualquier mo- 
mento puede ser caracterizada por la magnitud q(t) = u (t)/x (t) 
(consumo instantáneo de combustible en la unidad de espacio), 
que, como es nalural, va a depender del estado de la naturaleza 0, 
o sea, de los factores externos que determinan las condiciones de 
vuelo, 

La función de objetivo de tipo (6-30) se aplica raramente ya 
que la misma sólo ofrece la estimación de los valores instantáneos 
del proceso mandado cuando en la mayoría de los problemas re- 
sulta necesario estimar procesos en el objeto de mando durante 
todo el tiempo de mando de 0 a T. 

En muchos casos se logra seleccionar una función de objetivo 
tal que la estimación del proceso en el objeto controlado pueda 
efectuarse integrando la función de objetivo en todo el tiempo de 
mando, o sea, tomando como criterio de calidad de mando la fun- 
cional 


r 
Tl) = È Qo [x (8), u (0) dt. (6-31) 
¿ 


Así pues, si la función de objetivo tiene el sentido físico de las 
pérdidas, la expresión (6-31) determina la suma de pérdidas du- 
rante todo el proceso de mando. 

A veces, en calidad de objetivo de mando se logra presentar la 
marcha deseada del proceso z(t). Entonces, en calidad de función 
de objetivo puede tomarse el cuadrado o la magnitud absoluta de 
desviación del proceso x(f) respecto al deseado 

=lx(0—2(0P, q= |x) — z (01. (6-32) 

En estos casos el criterio de calidad de mando (6-31) va a de- 
terminar el error total cuadrático o el absoluto. 

En los problemas dinámicos de mando a la par con las limita- 
ciones del tipo (6-11), las cuales determinan el espacio de mandos 


admisibles U, nos vemos obligados a operar con limitaciones in- 
tegrales del tipo 


| Ho lx (0), u (6)] dt < K = const. (6-33) 
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Por ejemplo, muy a menudo tropezamos con la necesidad de 
acotar los límites de cambio del valor instantáneo de cierto pará- 
metro a(x, «) durante el proceso de mando. Designemos por 4o 
aquel valor del parámetro a que es indeseable que se sobrepase. Si 
la función subintegral H (x, u) se determina por la correlación 


0 para alx, u) < ay 


la(x, 1) aj para alx, u)>ap C39 


H(x, u)= [ 
la limitación integral (6-33) va a expresar el requerimiento de 
ue el valor instantáneo del parámetro a pueda sobrepasar de ay 
únicamente durante un corto tiempo y en un valor insignificante. 
Esta condición va a cumplirse tanto más rígidamente, cuanto me- 
nos sea K. Así pues, para K = 0, la limitación (6-33) no admitirá 
del todo que a exceda de ao. 

Las limitaciones del tipo (6-33) surgen asimismo cuando tene- 
mos que operar con recursos limitados: puede estar limitada, si 
se trata de trayectorias, la cantidad de energía, combustible de 
que se dispone, etc. 

Las correlaciones expuestas permiten dar la siguiente defini- 
ción del mando óptimo en los sistemas dinámicos. Se denomina 
óptimo el mando u*(t) elegido del espacio de mandos admisibles U, 
que para el objeto descrito por la ecuación (6-17) minimiza el 
criterio de calidad (6-31) con las limitaciones presentadas a los 
recursos a utilizar (6-33). 

Los problemas dinámicos de mando, al igual que los de un 
paso, pueden ser determinados, si el espacio de estados de la na- 
turaleza O consta de un solo elemento $ = dy y estocásticos, si 
dicho espacio O contiene más de un elemento y se ha estipulado la 
distribución aprioristica de las probabilidades ¿(0) en el espa- 
cio O, 

Entre los problemas estocásticos ocupan un importante lugar 
los de mando adaptable que se utiliza en los casos en que los datos 
apriorísticos sobre el estado de la naturaleza resultan insuficientes 
para llevar a cabo un mando eficaz, o falta una descripción mate- 
mática suficientemente exacta del propio objeto controlado. El 
mando adaptable tiene como finalidad precisar los datos acerca 
del estado de la naturaleza o las propiedades del objeto controlado 
directamente en el proceso de mando del objeto probando los dis- 
tintos métodos de mando y buscando aquel de ellos que resulte 
más eficaz en las condiciones concretas dadas. 


c) Mando del estado final 


En toda una serie de casos la naturaleza del movimiento del 
objeto durante el proceso de mando no presenta un interés subs- 
tancial y sólo es de importancia el estado que tomará el objeto en 
el momento en que termina el proceso de mando. Pueden servir de 


207 


ejemplos de problemas similares el aterrizaje “a ciegas” de un 
avión que plantea rigurosas exigencias a la velocidad y la posi- 
ción del avión en el momento en que toca tierra, el transporte de 
carga para un plazo dado a un punto de destinación dado, el al- 
cance a finales del año de una productividad del trabajo, etc. Estos 
problemas recibieron la denominación de problemas de mando del 
estado final. 

Designemos por x(7) el estado del objeto en el momento final. 
En el caso dado la función de objetivo va a tener la forma 

q = Qe [x (T)]. (6-35) 

Por cuanto x(T) depende de la naturaleza del mando em- 
pleado u(£), el valor q también dependerá del mismo. Por eso el 
problema de la elección del mando óptimo puede enunciarse para 
este caso del modo siguiente: elegir tal mando u*(£) del espacio 
de mandos admisibles U que para el objeto descrito por la ecua- 
ción diferencial (6-17) minimice la función de objetivo (6-35) con 
las limitaciones (6-33) de los recursos a utilizar. 


d) Juegos diferenciales 


La teoría de los juegos diferenciales constituye la extensión de 
la teoría de los juegos en los problemas de un paso al caso de los 
problemas dinámicos de mando, En los juegos diferenciales, como 
en los habituales, toman parte dos personas que se llaman jugado- 
res y cuyos intereses están contrapuestos. Con esto, cada uno de 
los jugadores puede dominar hasta cierto punto la situación in- 
fluyendo sobre el objeto con su mando propio. Esto significa que 
en los juegos diferenciales el espacio de mandos admisibles repre- 
senta el producto directo de los conjuntos 

Uxv, (6-36) 
donde U es el espacio de mandos admisibles del primer jugador 
con los elementos u(() y V es el espacio de mandos admisibles 
del segundo Jogador con los elementos v(t). De esta manera, los 
elementos del espacio de mandos admisibles van a representar pa- 
res del tipo (u, v), u Œ U, v € V. 

Si no existe indeterminación en el estado de la naturaleza la 
ecuación diferencial, que describe el movimiento del objeto contro- 
lado, se obtiene de (6-17) sustituyendo u por el par (u, v), es 
decir, tendrá la forma: 

i=g(x, u, 0), x(0) =c. (6-37) 

Los juegos diferenciales son de ordinario problemas para el 

mando del valor final. Por eso, la función de objetivo depende del 


estado del objeto en el momento final T que a su vez se determina 
por las ecuaciones utilizadas, o sea, puede escribirse en la forma: 


I=Q1UD), (7) =] luto), 0(0)). (6-33) 
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La contraposición de los objetivos de los jugadores consiste en 
lo siguiente: mientras el primer jugador tiende a minimizar la 
función de objetivo eligiendo el mando u del espacio U, los inte- 
reses del segundo requieren tal elección del mando v del espacio V, 
que maximice la función de objetivo. La esencia de la teoría de los 
juegos diferenciales es la búsqueda por cada uno de los jugadores, 
en esta situación tan contradictoria, de los métodos de determina- 
ción de su mando óptimo. 

Son ejemplos de situaciones características para los juegos di- 
ferenciales, las batallas, los combates aéreos, el fútbol, la persecu- 
ción de un bugue por un torpedo, la protección de objetos contra 
asaltos, etc. 


6-5. PROCESOS DE MANDO DE PASOS MULTIPLES 


a) Comportamiento de un sistema dinámico como función 
del estado inicial 


La búsqueda del mando óptimo en los sistemas dinámicos se 
facilita considerablemente en muchos casos si se logra fraccionar 
el proceso de mando de modo natural o artificial en pasos o etapas 
separados. 


o u ta 


Fig. 6-2. Fraccionamiento del intervalo en dos pasos 


Para efectuar el análisis en forma general, vamos a considerar 
que el estado del objeto sc describe con la variable multidimen- 
sional 

xm (d, 0), (6-39) 

Suponiendo que el proceso no es controlado y que no hay inde- 
terminación en el estado de la naturaleza, la ecuación diferencial 
que define el movimiento del objeto con (6-17) se escribirá por 
analogía en la forma 

i=8(x), x(0)=c. (6-40) 

La solución de esta ecuación se escribe corrientemente como 
x = x(t) con lo que se recalca que la solución depende del tiempo. 
Sin embargo, no es menos importante que la solución de la ecua- 
ción (6-40) depende del estado inicial c. Por eso es más rigurosa 
ta forma de notación que muestra la dependencia explícita de la 
solución x tanto del tiempo como del estado inicial: 


x=x(0, =x [e (0), i). (6-41) 


Esta forma de notación permite considerar el estado del sistema 
en el momento de tiempo arbitrario £ como cierta transformación 
del estado inicial x(0) = c en el intervalo £. 
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Examinemos el movimiento del objeto en el intervalo de O a fz 
que dividiremos con el punto intermedio f; en dos intervalos de 
duracion f, y t = tz — t, como se muestra en la figura 6-2. Exami- 
nemos tres estados del objeto controlado: 

estado inicial x(0)= c; 

estado x(c, fi) en el momento intermedio fi; 

estado x(c, t2) en el momento final fz. A 

Puede emplearse la descripción del último estado de doble ma- 
nera. Dicho estado puede considerarse como la transformación del 
estado inicial x(0) = c en el intervalo ta = fı + t 


xlc, t= x(c, fi +7), (6-42) 
o como la transformación del estado x(c, fı) en el intervalo t 
x(c, ta) = x [x (c, ti), +] (6-43) 


Como que ambas expresiones describen un mismo estado, en- 
tonces, igualándolas, obtenemos ła correlación 


xle, ti +1) =x[x(c, ti), th (6-44) 


b) Representación de un proceso dinámico en forma 
de sucesión de transformaciones 


Supongamos que el proceso dinámico x(c, t} en el intervalo de 
O a f' puede representarse de modo natural o artificial como pasos 
múltiples y hallemos el método apropiado de descripción de dicho 
proceso, Para obtener el proceso de pasos múltiples el intervalo 


0 t la De tp e 


n 
Fig. 6-3. Fraccionamiento del intervalo en n pasos 


de O a 1” debe ser fraccionado en n pasos consecutivos cuya dura- 
ción tomaremos igual a ti, ta, Tn como se muestra en la fi- 
gura 6-3, Designemos por tr (k = 0, ..., n) los momentos de ter- 
minación del f-ésimo paso de modo que tası = la + Tası Y pOr Xu 
el estado del objeto en el momento fa: 


x=x(0, ti). (6-45) 


El estado 
Hrs y lO, ing) = x (C, ta + Trgi). (6-46) 


Esta expresión puede representarse en concordancia con (6-44) 
y (6-45) en la forma 


Er = xla (c, ta), Tepi] = x (Xx, Tagi). (6-47) 


La correlación (6-47) representa el estado del objeto xx+ı como 
resultado de la transformación del estado xa en el paso (R + 1). 
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Introduzcamos en el análisis el operador T que va a designar 
la transformación del estado del proceso durante un paso: 


T (x) =X {Xs Tap) k= n=l. (6-48) 
Entonces la correlación (6-47) se escribirá en la forma 
Xryi = T (X4). (6-49) 


Suponiendo que k = 0, 1, ..., n— 1 podemos escribir todo el 
proceso dinámico en forma de la sucesión de transformaciones 


x=0 1 =T (Xd...) Xn =T (tami). (6-50) 


c) Proceso de mando de pasos múltiples 


El proceso dinámico descrito por la transformación (6-49) no 
es controlado, Para obtener un proceso controlado de pasos múlti- 
ples hay que tener la posibilidad de realizar en cada paso no una 
transformación 7 (xx) sino una del conjunto de transformaciones 
Trlxn), +++» Tr(xa). 

Es cómodo considerar que el tipo concreto de transformación 
dependerá del parámetro u, que en el f-ésimo paso puede tomar 


a) 


Fig. 6-4. Proceso de pasos múltiples con variable bidimensional 


uno de los valores del conjunto Us. Vamos a denominar el pará- 
metro ua mando y el conjunto U, espacio de mandos admisibles en 
el k-ésimo paso. Ahora puede escribirse la transformación reali- 
zada en el k-ésimo paso en la forma 


Xryr = T (<a, Us), 44 EUn (6-51) 
Si en la correlación (6-51) hacemos consecutivamente k = 
= 0, l, ..., n— l y tomamos en cuenta el estado inicial xo, ob- 


tendremos la descripción de todo el proceso de mando de pasos 
múltiples: 


Xapi =T (Xa, Ua), Ue SU; 
k=0, l, ..., n— l; xy =x(0)=0. (6-52) 
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La correlación (6-52) denominada ecuación de diferencias del 
objeto controlado es análoga a la ecuación diferencial (6-17) que 
proporciona la descripción del proceso dinámico continuo. 


Ejemplo 6-1. Supongamos que la variable de estado es una magnitud bidi- 
mensional x = (250,2) que puede tomar los. valores determinados geométri- 
camente por los nudos de la retícula repr en la figura 6-4,a. La tran- 
sición de un nudo de reticula al siguiente se realiza empleando en cada paso 
uno de los dos mandos posibles; xa = 0, movimiento en sentido horizontal 
y üa = I, movimiento en sentido vertical. Por consiguiente, el espacio de man- 
dos admisibles, igual para cualquier paso, es 


U¿=(0, 1), k=0, 1,....2n—l 


Examinemos uno de los cuadrados de la retícula dada que se muestra en 
la figura 5.4.0 en cuyo ángulo inferior izquierdo el sistema se vio después del 
h-ésimo paso, de modo que xa = {an bı). El valor Xa+1 = T (Xa. Un) depende de 
la ecuación aplicada. Como se ve, en la figura 6-+, 6 tienen lugar las siguientes 
correlaciones 


Tía, b1), O} = (0, b1) "ha 
Tifa bi) J= (a, 05) «fer 


La trayectoria concreta de movimiento del sistema puede describirse indi- 
cando el estado inincial xo y la suceción de ecuaciones empleadas Así, la tra- 
yectoria marcada por la linca gruesa en la figura 6-4, a, se obtiene utilizando el 
mundo u == (01101001) con las condiciones iniciales xo = (a, $). 


d) Criterio de calidad del mando en el proceso 
de pasos múltiples 


Vamos a considerar que la calidad del mando se determina por 
el valor de la función de objetivo q, cuyo valor numérico puede 
considerarse como pérdidas que tenemos empleando uno u otro 
mando. Las pérdidas en un paso van a depender del estado del 
proceso al comienzo del paso y del mando empleado en este paso, 
es decir, 

Gu =Q (xr, 44), ug Up. (6-53) 


Como criterio de calidad del mando pueden tomarse las pérdi- 
das completas durante todos tos n pasos del proceso y representar 
a criterio de calidad de mando del proceso de n-ésimo paso en la 
orma 


mi 


da (0) = E, Qe, ua). (6-54) 


Aquí por u se designa la sucesión de los mandos, o sea, un 
conjunto ordenado de tipo 


u= (lo, -oos Mi), 45 Us... lp EUn (6-55) 


Si se estudia el proceso de pasos múltiples de mando del valor 
final, las pérdidas van a depender solamente del estado del objeto 
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controlado al final del proceso cuyo estado depende, a su vez, del 
estado inicial y de los mandos empleados en cada paso: 


q= G (a) = Q (Xo, u). (6-56) 


donde u se determina por la correlación (6-55). Vamos a deno- 
minar función de objetivo del proceso de mando de pasos múltiples 
a la magnitud escalar determinada por la expresión (6-56). 

El problema de la búsqueda del mando óptimo en el proceso de 
pasos múltiples puede formularse del modo siguiente. Para el sis- 
tema dinámico, cuyos procesos se describen con la ecuación de di- 


ferencias (6-52), hallar tal sucesión de ecuaciones io, 141, ..., Lu=1 
que obedezcan a las limitaciones del tipo us € Ur, k = 0, 1, .. 
„n — i, la cual minimiza el criterio de calidad de mando (6-54) 


o la función de objetivo (6-56). 

Ya que los procesos de mando de pasos múltiples son un caso 
particular de procesos dinámicos de mando, entre ellos pueden en- 
contrarse problemas de todos aquellos tipos que se estudiaron en 
los problemas de mando dinámico. Asi pues, si el espacio de esta- 
dos de la naturaleza O consta de un solo elemento 0, el problema 
de mando de pasos múltiples se denomina determinado, En caso 
contrario éste pertenece a la clase de los problemas estocásticos. - 

Subrayemos que no siempre es posible incluir univocamente 
uno u otro problema en la clase de los problemas de pasos múl- 
tiplos o de un paso. Así pues, si en un problema de pasos múltiples 
la sucesión de valores de la variable que se toma en los pasos 
aislados se considera como una variable multidimensional, el pro- 
blema de pasos múltiples se convierte en problema de un paso. 


6-6. PROBLEMA DETERMINADO DE OPTIMIZACION 
DE UN PASO CON VARIABLE UNIDIMENSIONAL 
DE ESTADO 


a) Enunciado del problema 


Entre los variados problemas de optimización del mando el de 
un paso con variable unidimensional ocupa un lugar un tanto par- 
ticular. Esto es debido, en primera, a que en la práctica tales pro- 
blemas se encuentran con mucha frecuencia y en segunda, muchos 
problemas de pasos múltiples y de un paso con variable multidi- 
mensional incluyen en sí en calidad de etapas separadas de la re- 
solución un problema de un paso con variable unidimensional. 
Aunque.el problema de optimización de un paso con variable unidi- 
mensional puede ser resuelto en la mayoria de los casos por los 
medios del análisis matemático que se estudia en el curso de mate- 
máticas superiores, no obstante, el esclarecimiento de algunas 
propiedades de la resolución y el empleo de algunos procedimien- 
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tos de cálculo permiten en muchos casos simplificar notablemente 
el proceso de resolución. 

El problema determinado de optimización de un paso con va- 
riable unidimensional puede formularse del modo siguiente. Sea R 
el conjunto de números reales; X S R, el conjunto de los. valores 
admisibles de la variable unidimensional; y x, q(x), una función 
de x estipulada en el conjunto X. Se requiere hallar tal valor 
de x Æ X que se designará en lo-adelante por x* que convierte q (x) 
en el mínimo o máximo, es decir, satisface la condición 


x= {x € X :q (x)= min (máx). (6-57) 


Los métodos de resolución de este problema dependen del ca- 
rácter dei conjunto X de valores admisibles de la variable que 
vamos a suponer presentado en un intervalo real finito. Estudie- 
mos algunos casos particulares. 


b) Caso del conjunto finito de soluciones admisibles 


Analicemos el caso en que el conjunto de soluciones admisibles 
es finito 
X= {xp ..., Xy). (6-58) 


Con esto la función de objetivo q(x) se representará por el con- 
junto de números reales Q que pueden considerarse como el reflejo 
del conjunto X en el conjunto de los números reales R: 


Q: XR. (6-59) 


Los elementos del conjunto Q, es decir, los valores q(x) para 
todas x Œ X pueden hallarse por medio de cálculos. 

El procedimiento general para obtener el valor óptimo x* con- 
siste en comparar entre si por pares todos los elementos del con- 
junto Q y buscar entre ellos el elemento menor o mayor. Tal pro- 
cedimiento no es complicado si el conjunto X, y por ende, el 
conjunto Q tienen un pequeño número de elementos. Si el número 
de elementos del conjunto X es grande, el procedimiento dado re- 
querirá un considerable gasto de tiempo lo que va asociado, en 
primer lugar, a la necesidad de calcular muchas veces el valor 
q(x). 
El único modo de simplificar este procedimiento sólo puede ser, 
el intentar a disminuir el número de elementos del conjunto X eli- 
minando aquellos elementos con respecto a los cuales podemos 
estar convencidos [no fundándose en el cálculo de los valores q(x) 
sino basándose en indicios secundarios cualesquiera], de que entre 
ellos no puede estar contenido el valor x*. Más adelante se pon- 
drán ejemplos del empleo de este procedimiento que, claro está, 
siempre debe tenerse presente al resolver problemas con variables. 
multidimensionales. 
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c) Caso del conjunto infinito limitado de soluciones 
admisibles 


El caso que se encuentra con más frecuencia es aquel en que 
el conjunto X de valores admisibles de la variable representa el 
intervalo real continuo limitado por los números a y b: 


X=(xSR:a<x<bj=la, bl. (6-60) 


Vamos a suponer que la función q(x) es continua y diferen- 
ciable en cada punto del intervalo [a, b} con la excepción posible 
de un número finito de puntos. En la figura 6-5 se muestra un 
ejemplo de función que satisface este requisito. 

Designemos por x*, como antes, el valor x= X con el cual se 
alcanza el mínimo o el máximo de la función q(x). Como funda- 
mento para la determinación de x” ponemos el conocido postulado 
del curso de análisis matemático consis- 
tente en que para una función continua 47% - 
y diferenciable sólo puede tener lugar 
máximo o mínimo en aquellos puntos 
donde la derivada es cero. Estos puntos 
pueden hallarse por la ecuación 


q(x) =0. em A 
No obstante, en el intervalo la, b] Fig, 6-5. Ejemplo de fim- 
ueden encontrarse puntos en los cuales ción de objetivo 
a derivada no existe, como por ejemplo 
el punto M en la figura 6-5, y también los extremos del inter- 
valo a y b. En estos puntos que no obedecen a la condición (6-61) 
puede hallarse asimismo un máximo o mínimo de la función 
q(x). 
ara formular la regla general introduzcamos las siguientes 
notaciones. Designemos por 


S= {xE X: qg ()=0) (6-62) 


el conjunto de puntos del intervalo (a, b), en los que la derivada se 
reduce a cero; 


Sa= {x & X :q' (x) no existe) (6-63) 
el conjunto de puntos del intervalo (a, b], en los cuates no existe 
la derivada; 

S= (a, b} (6-64) 


el conjunto de puntos consistentes en los extremos del intervalo 
la, bl. 

El valor x* que minimiza o maximiza q(x) se encontrará, sin 
falta, entre los puntos del conjunto S,, entre los puntos del con- 
junto Sz o entre los puntos del conjunto Sy. En otras palabras, el 
valor x = x* debe buscarse entre los puntos £ del conjunto $ de- 
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terminado por la condición 
S=S USUS: (6-65) 


que es un conjunto finito. Esta regla reduce el problema de buscar 
el valor óptimo x*, al análisis del caso anterior del conjunto finito 
de soluciones admisibles. 


Ejemplo 6-2. Para la función dada en la figura 6-5 tenemos Si = (xi), 
Sa = (xa), Sa = (0,0). 
Luego, $ = (a, xn xa, b). 
Ejemplo 6-3. Sean X = [0, 2], a0=|* 
ción de la magnitud absoluta de la y real 
! I=( — y para y<0, 
e y para y>0, 


+l- Como según la defini- 


q(x) puede representarse en la forma 


T pinh 
q) = 1 1 
- ara Rs 
AO Y 


Diferenciando por x, obtenemos: 


—1 para x< 


z 


dm i 
+l para x> -7- 

En el punto x =1/, la derivada no existe, ya que los valores g'(x) en las 
cercanías de este punto son diferentes a la izquierda y a la derecha, Como 
vemos, en el intervalo [0,2] no hay valores de x para los cuales g'(x) = 0. De 
esta suerte, Sy == Ø, Sz = {1/2}, Ss = (0,2) y S = (0, 1/2, 2). 

Calculando los valores g(x) para todas las x $, obtenemos mín g(x) = 0 

ze 


para x = 4/2, máx q(x) = 3/2 para x = 2. 
xan 


Hay que recalcar que los valores z = S determinan los mínimos 
y máximos relativos o locales, es decir, aquellos puntos X del con- 
junto X para los que 


q(3)<g(x) o q(3>g9(x) 


ara todas las x suficientemente próximas a %. Es cierto que entre 
os puntos $ = S pueden hallarse también algunos en los que no 
hay máximo ni mínimo relativos, por ejemplo, los puntos de in- 
flexión. El cálculo de los valores q(x) en los puntos x = že S 
tiene el objetivo de separar el mínimo o máximo absolutos de la 
función q(x). Con esto, el procedimiento de resolución descrito 
anteriormente puede resultar bastante complejo si el número de 
elementos del conjunto S es grande y la función q(x), complicada 
para los cálculos, 
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La simplificación de la resolución del problema consiste en 
disminuir el número de elementos del conjunto S lo que puede 
lograrse cambiando el cáiculo de la función q(x) por el cálculo de 
las derivadas si éstas tienen una expresión más sencilla que la 
propia función. Con esto pueden aplicarse los métodos de elimina- 
ción, conocidos del curso de matemáticas superiores, de algunos 
elementos del conjunto S basados en la comparación de los signos 
de las derivadas o en el cálculo de las derivadas de órdenes supe- 
riores. 

Ejemplo 6-4, Hallar, el valor de x= x* que maximiza la función g(x) == 
= e-x en el intervalo X = [—1. +1] 

De la condición g'(x)=-—2xe""=0_ hallamos que Si =(0) Por 
guanto le función qie) es continua, Sm 0 y Sa = (1. + 1), De esta manera, 

=a (1,0, +1 

Tratemos de disminuir el número de elementos del conjunto S. Por cuanto 
>0 para x<0; 


TOS] <o para x>0, 


en los puntos del conjunto Sa no puede haber máximo y para el punto x = 0 
se satisfacen las condiciones de máximo, Por tanto, $= S, = (0), x" = 0, 
YU) = e = 


En el siguiente ejemplo examinaremos las dificultades que sur- 
gen al resolver problemas con vałores numéricos enteros de las 
variables. 


Ejemplo 6-5. Hallar el valor de f==(* que maximiza la función q() = 
== 1001 — 3 en el conjunto X = {i æ R: i, entero; 0 & i << 100). 

Aqui el dominio de valores admisibles de la variable representa un con- 
junto finito. Sin embargo, este último contiene un número tan grande de elemen- 
tos, que resulta difícil comparar directamente los valores q(í) para todos los 
elementos del conjunto X. En estos problemas siempre hay que tratar de exten- 
der el dominio de valores admisibles de la variable de suerte que ella represente 
un intervalo continuo, Por ejemplo, puede sustiluirse X por X = {x & R :0 < 
Æ x < 100) de modo que X œ X. Si ahora, en lugar de q(i) se construye una 
mueva función q.(x) tal que para x = ig, (x) = a(i), puede reemplazarse el pro 
blema de hallar la x* == X que maximice g(i) por €l de encontrar x* Œ X, que 
maximice qı (x). 

Hagamos qı(x) = 100x —3x3 en el ejemplo considerado, Entonces 
Sı = (16,7), Se=Ø y Sa== (0; 100). De esta forma, S= (0; 16,7; 100) 
y x” = Í6,7. Sin embargo, el valor de x* obtenido no es elemento del con- 
junto X. Por cso hay que hallar ei valor óptimo de i* entre los elementos del 
conjunto X adyacentes a x*, Asi pues, obtenemos í* e (16; 17} de donde halla- 
mos que i* = 17, q(i") = 833. 


d) Aplicación de las fórmulas de interpolación 


En diversos casos, como por ejemplo, al optimizar algunas eta- 
pas de un proceso de pasos múltiples la función q(x) no se pre- 
senta a modo de fórmula sino que se indica únicamente el procedi- 
miento de obtención de los valores q(x). En estos problemas re- 
sulta imposible emplear los métodos analíticos descritos en la 
sección precedente y para juzgar sobre la naturaleza de la función 
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4(x) hay que encontrar todos los valores tomados por esta función 
en el intervalo de los valores admisibles de la variable X = (a, b]. 
Por cuanto, es evidentemente imposible exponer en forma tabular 
todos los valores de la función q(x), se requiere calcular q(x) 
para cierto subconjunto finito X del conjunto X y después utilizar 
los resultados obtenidos para darse una idea de Cómo se comporta 
esta función en todo el intervalo (a, b]. Este procedimiento se deno- 
mina interpolación de la función q(x). Sin detenernos en los pro- 
blemas generales de la teoría de la interpolación, examinemos sólo 
una de las fórmulas de interpolación más difundidas denominada 
fórmula de Newton. 

Supongamos que en el intervalo fa, 6] se han tomado n + 1 
valores discretos equidistantes de x que constituyen el conjunto 

, Xn = b} siendo x; = xo + iô, i = 0, I, ..., n, 

alo entre los valores discretos adyacentes. 

Vamos a considerar que se han calculado los valores q(x) para 
x EX que son iguales a yy = q(x;), i = 0, 1,..., n. La interpola- 
ción consiste en que se elige el polinomio p(x). de un grado no 
superior a n que toma en los puntos x = x; los valores p(x) = yi 
Los valores de este polinomio para cualquier x € [a, b] se toman 
como valores de q (x). 

Escribamos el polinomio p(x) en la forma 


P (x) == ao + a, (x — xo) -+ aa (x — xo) (x — x1) + 
+ a(x — xo) (x — xi) (x = xa) H ooo 
+ an (x — xo) (x — xi) ... (*— Xn) (6-66) 
Determinemos los coeficientes ao, a,, 


y An de suerte que 


Pd yo PI) =Yw <<, Pa) = Yn 
Sustituyendo en (6-66) en lugar de x consecutivamente los va- 
lores xo, Xt, «+», Xn, obtenemos que 
W= O a= Yo; 
1N=0+a(—x)=y+ab o a 47%; 
Ya = Ao + A (Xe — Xo) + 02 (X2 — xo) (x2 — x1) = 
=yø+2(n— y) + 20a o q= UE, 


Este proceso de cálculo consecutivo de coeficientes puede conti- 
nuarse más adelante. 

Para la más cómoda notación de los coeficientes es conveniente 
introducir designaciones especiales para las diferencias de valores 
de las funciones. Se denominan primeras diferencias las magnitu- 
des 


DY = Yi — ye R=0, 1 nl. 
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Las diferencias de las primeras diferencias se denominan dife- 
rencias secundarias y se designan por 


Aya = Ayres — Ds = Yrgo — Pao F Yao 


Análogamente pueden introducirse las diferencias tercera, cuar- 
ta, etc. Por ejemplo, 


Ayr = Ayer — ya = Y ies — Yare H Iyisi — Ye 


Teniendo en cuenta estas designaciones las fórmulas para los 
coeficientes toman la forma: 


Mo. EJ Ay 
“=p a=; m= o ae 


Sustituyendo estos valores en la fórmula (6-66), obtenemos la 
fórmula de interpolación de Newton: 


TN o e E EE 


o + (A. (7). (6-67) 


Esta fórmula se escribe corrientemente de otra manera, ha- 
ciendo 


x= 


=u 0 x= x4 ðu (6-68) 


Tomando en consideración (6-68), la fórmula de Newton ad- 
quiere la forma de 


p(x) = p (Xo + ò4) = yo + u Ayo + 
E ds 1) A+ iioi Y (u—n+ Dago. (6-69) 


En diversos casos para interpolar es cómodo emplear la fór- 
mula 


HT" (6-70) 


Es evidente la validez de esta fórmula porque, en primera, ella 
representa un polinomio de x, y, en segunda, para ¥ = Xn k = 
= 0, l,..., n los valores p(x») resultan iguales a y». 


Capítulo séptimo 
PROGRAMACIÓN LINEAL 


7-1. ENUNCIADO DEL PROBLEMA 
DE LA PROGRAMACION LINEAL 


a) Definiciones fundamentales 


Como se indicó en el capítulo 6, el término “programación li- 
neal” está relacionado con la investigación y resolución del pro- 
blema siguiente. 

Está dado un sistema de m ecuaciones lineales independientes 
con n incógnitas xı, ..., Xn llamado sistema de limitaciones del 
problema de programación lineal: 


ax +... Ha, 


(7-1) 


El rasgo característico del problema dado es que e! número de 
ecuaciones es menor que el de incógnitas, o sea, m < n. Se re- 
quiere hallar los valores no negativos de las variables (x; = 0, 
i= 1, ..., n) que satisfacen las ecuaciones (7-1) y minimizan la 
función de objetivo: 

q= coH etit e H Cat (7-2) 
frecuentemente denominada forma lineal. 

Hágamos algunas aclaraciones a propósito de este problema. 
El sistema de ecuaciones (7-1) para el caso en que el número de 
ecuaciones es igual al número de incógnitas (m = n) se estudia 
en el álgebra ordinaria. Si con esto la determinante del sistema no 
es igual a cero, el sistema tiene una sola solución y para hallarla 
hay procedimientos bien elaborados. Si el número de ecuaciones 
es menor que el de incógnitas (m < n), el sistema de ecuaciones 
(7-1) tiene un conjunto infinito de soluciones, es decir, hay un 
conjunto infinito de colecciones de variables x; (i == 1, ..., n) que 
satisfacen las ecuaciones (7-1). Vamos a llamar solución a cada 
colección de variables x; (i = l,..., n) que satisface el sistema de 
ecuaciones (7-1). 

No obstante, se ha impuesto a las variables x, una limitación 
adicional que consiste en que estas variables deben ser no nega- 
tivas (x: 0). En el caso general hay un conjunto infinito de 
soluciones que satisfacen esta condición adicional. Vamos a llamar 
solución admisible a cualquier solución del sistema (7-1) con va- 
lores no negativos de las variables. De este modo, la esencia del 
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problema de la programación lineal consiste en elegir del conjunto 
de soluciones admisibles una solución y precisamente tal que mini- 
miza la forma lineal (7-2). 

A veces en un problema de programación lineal todas o algu- 
nas de las ecuaciones del tipo (7-1) tienen la forma de desigualda- 
des. Así, en lugar de la ecuación 


Gpkd ... + apta =b1 (7-3) 
puede formar parte del sistema (7-1) una desigualdad del tipo 
anxi + F Anta S bj, (7-4) 


o bien 
anit aee + apăr > bj- (7-5) 


Pero es fácil transformar estas desigualdades en ecuaciones, 
introduciendo la variable adicional xa+; > 0 de modo que, según 
el signo de la desigualdad, tenga lugar una de las dos expresiones 


Apta e px =p ) 
Apta E -e E aa — Xn = bje 


Este cambio provoca simplemente el aumento del número de 
variables lo que no altera la esencia del problema. 

A veces no existe el problema de minimizar la forma lineal 
(7-2) sino de maximizarla. Este problema se reduce al anterior 
cambiando el signo de la expresión para q. Por cuanto en lo suce- 
sivo van a encontrarse problemas de ambos tipos, acordemos de- 
signar el valor de la función de objetivo por q, si hay que mini- 
mizarla y por q”, si debe ser maximizada. 

Antes de buscar la solución de la ecuación (7-1) que satisface 
todas las exigencias impuestas (x; = 0, i = 1, ..., n; q = min), 
tratemos de hallar alguna solución de la ecuación (7-1). Por 
cuanto el número de variables n en este sistema es mayor que el 
de ecuaciones m, una de las soluciones posibles puede follarse si 
hacemos igual a cero n — m variables cualesquiera. El sistema de 
m ecuaciones con m incógnitas puede resolverse por los métodos 
habituales del álgebra. Es verdad que para que el sistema de m 
ecuaciones con m incógnitas tenga solución, es necesario que no 
se reduzca a cero la determinante compuesta con los coeficientes 
de las incógnitas. Si esta condición no se cumple, pueden igualarse 
a cero otras n — m variables. La solución obtenida con esto se de- 
nomina solución de base. Ahora podemos introducir la terminolo- 
gía que se emplea ampliamente en los problemas de programación 
lineal. 

Se denomina base calquier colección de m variables tales que 
la determinante compuesta con los coeficientes de estas variables 
no es igual a cero. Estas m variables se denominan variables: de 
base (con respecto a la base dada). Las n — m variables restantes 
se denominan variables no de base o libres. En cada, sistema de 


(7-6) 
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ecuaciones concreto (7-1) pueden existir varias bases diferentes 
con distintas variables de base. 

Si hacemos iguales a cero todas las variables libres y resolve- 
mos el sistema obtenido de m ecuaciones con m incógnitas, logra- 
mos llegar a la solución de base. Pero entre las diferentes solucio- 
nes de base van a haber algunas que dan valores negativos de 
ciertas variables. Estas soluciones de base contradicen la hipótesis 
del problema y son inadmisibles. 

onstituye una solución de base admisible la que es admisible 
simultáneamente, o sea, la solución de base que da valores no ne- 
gativos de las variables de base. Las soluciones de base admisibles 
son las más sencillas de las soluciones admisibles del sistema (7-1). 
No obstante, en la solución del problema se implanta una condi- 
ción adicional: la forma lineal (7-2) debe adquirir el valor mínimo 
con la solución hallada. Con esta condición adicional se complica 
la solución del problema, no obstante, el concepto de solución de 
base admisible juega un papel importantísimo al hallar la solueión 
completa del problema. 


b) Ejemplos de problemas de programación lineal 


La programación lineal surgió debido al estudio de los asuntos 
relacionados con la búsqueda de las variantes más ventajosas 
durante la resolución de diversos problemas de planificación y pro- 
ducción, En estos problemas existen una gran libertad de variación 
de diferentes parámetros y una serie de condiciones limitadoras. 
Se requiere hallar tales valores de los parámetros que desde algún 
punto de vista sean los mejores. Se catalogan entre dichos proble- 
mas los de la búsqueda del método más racional de utilización de 
las materias primas y los materiales, la determinación de los regí- 
menes de producción más ventajosos, el aumento de la eficacia de 
funcionamiento de los medios de transporte, etc. Durante el mando 
automático del proceso de producción estas tareas deben solucio- 
narse automática y continuamente. Por eso, el conocimiento de los 
métodos de resolución de problemas similares que es necesario 
para cualquier ingeniero, se convierte sumamente valioso para el 
especialista en automática. 

Aclararemos con una serie de ejemplos la esencia de los pro- 
blemas de programación lineal. 


Ejemplo 7-1. Problema de la utilización de recursos. Para realizar I pro- 
cesos tecnológicos diferentes Ti, ..., Ty una fábrica necesita m tipos de recur- 
sos Su .... Sm (materias primas, combustible, materiales, herramientas, etc), 
Las reservas de recursos de cada tipo son limitadas e iguales a bu ..., bm. 
Se conoce el gasto de recursos por unidad de producción en cada proceso tecno- 
lógico. Se requiere determinar qué cantidad de producción de cada tipo hay que 
elaborar para que sea máximo el ingreso debido a la realización de esta pro- 
ducción. 

Designemos por ay el gasto de los recursos del tipo S: por unidad de 
producción del tipo T) y por cs, el ingreso debido a la realización de la unidad 
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de producción del tipo 7; Representemos todos los dados existentes cn forma 
de la tabla 7-1 suponiendo para ser concretos que /=3 y m = & 
Tabla 7-1 


Anotación de los datos iniciales en el problema 
de la utilización de recursos 


Gasto de recursos 
por unidad de producción | Reservas 
“Tipos de recursos ne de 


recursos 
i h E 
Sı an an an br 
Sa an an da ba 
S as an an bs 
Si an an an b 
Ingresos por reali- a a a - 


zación de la 
unidad de pro- 
ducción P 


Designemos por xy el número de unidades de producción elaborada del 
tipo Tj. Son limitaciones en este problema los requerimientos de que el gasto 
de los recursos del tipo Si (i= I, ..., m) para la claboración de lodos los 
tipos de producción no sobrepase de las reservas existentes; 


Š 


Estas Jimitaciones se convierten fácilmente en ecuaciones, introduciendo las 
variables x+ æ 0, que significan los recursos no utilizados del tipo S: Con 
esto, en lugar de (7-7) obtenemos: 


t 
2 e a 


La magnitud del ingreso debido a la realización de la producción elaborada 
será igual a A 
q= È exp (7-9) 


El plan óplimo de elaboración de la producción será la solución no nega- 
tiva del sistema de ecuaciones (7-8) con la que la función de objetivo (7-9) 
sea máxima. 

Ejemplo 7-2. Problema de la distribución por empresas de la producción ela- 
borada. El plan de la rama industrial prevé durante el tiempo 7 ja elaboración 
de los tipos de producción siguientes: 


A, en cantidad de N, unidades; 
As en cantidad de Na unidades; 


yA bj im mo (7-7) 


(7-8) 


A en cantidad de M, unidades. 


Estos tipos de producción pueden elaborarse en r empresas similares 
Es . , E- Supongamos que ninguna de las empresas puede elaborar simul- 
táneamente varios tipos de productos. Además, están dados: 

as la cantidad del producto A, elaborada en la empresa Es en la unidad 
de tiempo; 

bip el costo de la unidad del producto del tipo Ay elaborada en la em- 
presa Es; 

Xu el tiempo de funcionamiento de la empresa E, para elaborar el pro- 
ducto Á4. 

Se requiere hallar los valores xi, con los que será mínimo el costo de la 
producción elaborada, 

Limitaciones: 

1) el tiempo de funcionamiento de cada empresa no debe exceder de T 


; 
Zus im 


i 


(7-10) 


2) la cantidad del producto elaborado debe corresponder a la nomenclatura 


2 xy =p 1t.. 


$ (7-11) 


La función de objetivo va a representar el costo total de la producción ela: 
borada. Si se toma en cuenta que la magnitud a(yb,,xi, representa el costo de 
la parte de la producción A, elaborada por la empresa Ej, el costo total de la 


producción elaborada es 
ds 

2 2 abi (7-12) 
A f 


Según las condiciones del problema esta magnitud debe minimizarse al 
cumplirse las fimitaciones (7-10) y (7-11) 

Ejemplo 7-3. Problema del transporte. En los puntos Ps, ..., Pi hay un 
peso homogéneo en cantidades as ..., q Es necesario tramsportarlo a los 
puntos Qi, + Qr en cantidades b, de suerte que el costo total del 
transporte sea minimo. Con esto se presupone que la cantidad de carga re- 
querida es igual a las reservas existentes 


(7-13) 


Designemos por xiy lan cantidad de carga transportada del punto P: al 
punto Q), y por cs, el costo de transporte de la unidad de esta carga. En el 
problema hay las limitaciones siguientes: 

1) la cantidad de carga enviada del punto P, a todos los puntos de desti- 
nación debe ser igual a las reservas existentes ay: 


i 
£y=4p i=l, (7-14) 
y a 

fi 


2) la cantidad de carga que llega a Q; desde todos los puntos de envio 
debe ser igual a la necesidad by 


1 
=p i= (7-15) 
fi 
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La función de objetivo determina el costo total de transporte de todas las 


cargas p 
ps e (7-16) 


Ejemplo 7-4. Problema de selección de la versión óptima de un equipo. Se 
necesita proyectar un dispositivo calculador numérico que debe efectuar sucesiva- 
mente r operaciones matemáticas y conforme a esto consta de r bloques en 
serie. Hay 1 versiones diferentes de ejecución de cada bloque: con tubos electró- 
nicos. elementos semiconductores, elementos de ferrita y transistores, micromó- 
dulos, etc. Se han establecido limitaciones con respecto al costo máximo (X). las 
dimensiones exteriores máximas (Y) y el tiempo máximo de realización de 
las operaciones (Z). Se requiere elegir la versión más ventajosa desde el punto 
de vista de las exigencias planteadas. 

Desiguemos por Xi yi Zu respectivamente, el costo, las dimensiones y el 
tiempo de realización de una operación para el bloque i Entonces, las limita- 
ciones existentes pueden escribirse en la forma 


Laus, usr. uz (7-17) 
i E 


A 


Las magnitudes xi W: y Z: dependen de la versión de ejecución del blo- 
que, €s decis, son elementos de los conjuntos siguientes: 


QS o o A MEP ee Yale 
js E (7-18) 


donde las magnitudes xi, ye, zu significan, respectivamente, el costo, las 
dimensiones exteriores y el tiempo de realización de una operación para 
bloque ¡ con la versión de ejecución j. 

Si cs Ca cs son los coeficientes que caracterizan el valor relativo de la 
disminución del costo, las dimensiones exteriores y el tiempo de realización de 
las operaciones, entonces, la condición de la versión óptima del equipo se 
escribirá en la Jorma 


q. (7-19) 


La particularidad del problema dado que lo diferencia del de programación 
lineal enunciado inicialmente es que aunque las limitaciones (7-47) y la función 
de objetivo (7-19) son lineales, no obstante, las variables xa ya zi no pueden 
tomar cualesquiera valores no negativos, sino únicamente los de los conjuntos 
finitos (7-18). Por eso, los métodos corrientes de programación lineal no son 
aplicables al problema dado y éste debe resolverse por los métodos de pro- 
gramación discreta (de números enteros). 


c) Interpretación geométrica del problema 
de programación lineal 


Para tener una idea más completa del problema de la progra- 
mación lineal daremos la interpretación geométrica del problema 
siguiente. Se tiene el sistema de ecuaciones 


—2x1 + a + =2; 
Xi — 2x2 + Xa 
ntet 
8 aak 53 225 


(7-20) 


y la función de objetivo 
I=%M—X. (7-21) 


Se pretende hallar los valores no negativos de las variables 
que satisfacen las ecuaciones (7-20) y que minimizan la función 
de objetivo (7-21). Nos será más cómodo dar las reglas de solución 
del problema de programación lineal para el caso de maximización 
de la función de objetivo, lo que es fácil hacer tomando en calidad 
de función de objetivo la expresión 


Y =—q =r — to (7-22) 


En el ejemplo considerado el número de ecuaciones es m = 3 
y el de incógnitas, n = 5, asi que hay m = 3 variables de base 
y n— m = 2 variables libres. H hecho de que sólo hay dos va- 
riables libres hace posible ilustrar geométricamente la solución del 
problema en el espacio binario, es decir, en el plano. 

El sistema de tres ecuaciones (7-20) puede resolverse con res- 
pecto a tres variables, por ejemplo, xa, x4 y xs expresándolas por 
medio de x; y xz; al hacerlo, obtenemo: 


n=2+ 2x — 
1=2—x, +2 } (7-23) 
5—2 — to 


Xs 
Por condición del problema de programación lineal las va- 
riables sólo pueden tomar valores no negativos, es decir, el domi- 
nio de valores admisibles de las variables será el dominio deter- 
minado por las condiciones 


x1>0, i=l, 2, 3, 4, 5. (7-24) 


Cada una de las desigualdades (7-24) define cierto semiplano 
en el plano (xı, xa). Así pues, la desigualdad xı => 0 define el semi- 
plano superior y la desigualdad xa > 0, el semiplano que se en- 
cuentra por un lado de la recta 2 + 2x, — x2 == 0 y precisamente 
aquel que contiene el origen de coordenadas, lo que se comprueba 
con facilidad sustituyendo en la primera de las desigualdades 
(7-23) las coordenadas del punto (0, 0). El dominio correspon- 
diente a xa < 0 se llama prohibido y es útil marcarlo mediante 
rayado como se muestra en la figura 7-1. 

En la figura 7-2 se muestran trazados similares para todas 
las xy. En esta figura las rectas correspondientes a la condición 
x = 0 (i = |, 2, 3, 4, 5) están marcadas las cifras. Los dominios 
prohibidos correspondientes a la condición xy < 0 están marcados 
por rayado. Como se ve en la figura 7-2 el dominio de valores ad- 
misibles de las variables xı y xz es la zona obscura que representa 
el polígono oabcd, Tiene importancia apuntar que el polígono de 
soluciones admisibles es convexo ya que constituye la intersección 
de los dominios convexos definidos por las condiciones x; > 0, 
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El trazado realizado permite dar la interpretación geométrica 
de la solución de base. Como que cada recta en la figura 7-2 co- 
rresponde a la anulación de una de las variables, en los puntos de 
intersección de dos rectas van a convertirse en cero dos, es decir, 
n — m variables. Pero n — m es el número de variables libres cuya 
anulación corresponde a la solución de base. De esta manera, los 
puntos de intersección de las rectas x; = 0 (i=1,..., 5) deter- 
minan las soluciones de base de los problemas de programación 
lineal. 

Entre las soluciones de base hay algunas que no pertenecen al 
dominio de soluciones admisibles. Estas son soluciones de base 
inadmisibles. Sólo pertenecen al dominio de soluciones admisibles 
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Fig. 7-1. Semiptano Fig. 7-2, Poligono de soluciones 
24 2x1 — xa > 0 admisibles 


aquellos puntos de intersección de las rectas x; = 0 que son vérti- 
del polígono de soluciones admisibles. Por consiguiente, los 
vértices del poligono de soluciones admisibles corresponden a solu- 
ciones de base admisibles. 

Examinemos ahora la condición de maximización de la función 
de objetivo (7-22). Geómétricamente, con cualquier q” la expresión 
(7-22) define una recta trazada formando ángulo de 45° con el eje 
de las abscisas, con esto, al incremento de q” corresponde el des- 
plazamiento de la recta en la dirección de la flecha mostrada en 
la figura 7-2. Esta recta estará compatible con la solución admi- 
sible del problema sólo en el caso cuando tenga puntos comunes 
con el dominio de soluciones admisibles. El valor máximo de q” se 
obtiene con recta en la posición extrema cuando ella se convierte 
en recta de apoyo hacia el dominio de soluciones admisibles (línea 
de trazos en la figura 7-2). No obstante, la recta de apoyo que va 
al polígono convexo pasa, sin falta, a través de uno siquiera de sus 
vértices que, como vimos, corresponden a las soluciones de base 
admisibles. 

De esta manera, llegamos a la deducción importantísima de que 
la solución de un problema de programación linea! que convierte 
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en máximo la función de objetivo 9”, se halla sin aflta entre las 
soluciones de base admisibles. 

Esta deducción se generaliza fácilmente para el caso de m y n 
arbitrarios, cuando n— m > 2, En este caso las condiciones 
x:>0 (i= l, ..., n) determinan los semiespacios en el espacio 


multidimensional cuya intersección definirá el dominio de solu- 
ciones admisibles en forma de poliedro convexo. Los vértices de 
este poliedro corresponderán a las soluciones de base admisibles. 
La expresión para la función de objetivo define el hiperplano en el 
espacio multidimensional considerado, cuyo hiperplano con la con- 
dición g'=máx será de apoyo al poliedro de soluciones admisibles, 
es decir, pasarán sin falta por uno siquiera de los vértices. En este 
caso la solución del problema de programación lineal va a hallarse 
también entre las soluciones de base admisibles. 

La deducción obtenida permite determinar el procedimiento de 
resolución del problema de programación lineal. Por cuanto la so- 
dición será de apoyo al poliedro de soluciones admisibles, cuyo 
número es finito, pueden hallarse todas tas soluciones de base 
admisibles y calcularse el valor de q” para cada una de ellas. 
La solución definitiva es aquella de las “soluciones halladas para 
la cual el valor q” será máximo. 

Este procedimiento de resolución del problema aunque factible 
es sumamente engorroso ya que el número de soluciones de base 
admisibles puede ser muy grande. No obstante, existen métodos 
racionales de selccción consecutiva de las soluciones de base, que 
permiten examinar no todas las soluciones de base admisibles sino 
un número mínimo de ellas. Uno de los métodos más difundidos 
de esta selección es el llamado método símplex a cuyo estudio 
estará dedicado el párrafo siguiente. 


7-2. RESOLUCION DEL PROBLEMA 
DE PROGRAMACION LINEAL 


a) Algebra del método símplex 


La esencia del método símplex consiste en lo siguiente. Ante 
todo se halla alguna solución de base admisible. Esta puede encon- 
trarse tomando n — m variables cualesquiera como libres, igualán- 
dolas a cero y resolviendo el sistema de ecuaciones obtenido (7-1). 
Si con esto resultan negativas algunas de las variables de base, es 
eraa elegir otras variables fibres, o sea, pasar a una nueva 

ase. 

Después de haberse enconirado la solución de base admisible 
se comprueba si no se ha alcanzado ya el máximo de la función 
de objetivo q’. Si no es así, se busca una nueva solución de base, 
pero no cualquiera sino aquella que aumenta el valor de la función 
de objetivo g’. Después se repite ei proceso. Por cuanto en calidad 
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de nueva solución de base admisible se elige sólo aquella que 
aumenta el valor de la función de objetivo, el método dado brinda 
la posibilidad de examinar un mínimo de soluciones de base admi- 
sibles y conduce con bastante rapidez al objetivo. Analicemos este 
método más detalladamente con el ejemplo examinado anterior- 
mente, 

Recurramos al sistema de ecuaciones (7-20) para el cual se 
requiere hallar una solución negativa que maximice la función de 
objetivo (7-22). Por cuanto n — m = 2, pueden tomarse en calidad 
de variables libres dos cualesquiera, por ejemplo xı y x2 Igualán- 
dolas a cero, de (7-20) hallamos la solución de base xı = x = 0, 
2, xs= 5 que es admisible y con la cual g= 


x — . 

La comprobación de si con la solución hallada ha alcanzado o 
no el máximo de la función de objetivo puede efectuarse buscando 
una nueva solución de base con la cual dicha función será mayor. 
Para el paso a la nueva solución de base admisible hay que hacer 
variable de base una de las variables libres x; o xz. Con esto ella 
va a ser diferente de cero, es decir, crecerá, Por consiguiente, sí 
cualquiera de las variables libres forma parte de la expresión para 
ta función de objetivo con signo «+», vale decir, al aumentar ésta 
crece la función de objetivo, entonces no se ha alcanzado el má- 
ximo de la función de objetivo y hay que convertir la variable dada 
en variable de base haciéndola diferente de cero, 

Sin embargo, en caso de crecer la variable libre comienzan a 
disminuir algunas de las variables de base. Como que los valores 
negativos de las variables son inadmisibles, hay que tomar en 
calidad de nueva variable libre aquella de las variables de base 
que se convierte en cero antes que las demás. 

En el ejemplo examinado forma parte de la expresión para la 
función de objetivo (7-22) con signo «+» la variable libre xı, Esto 
significa que la función de objetivo no ha alcanzado el máximo y 
debe hacerse variable de base la xı, Para determinar la nueva 
variable libre expresaremos las variables de base xa, Xi, Xs por me- 
dio de las variables libres reduciendo las ecuaciones (7-20) a la 
forma (7-23). En estas ecuaciones vemos que con x¿=0 el 
aumento de x; no provoca la disminución de xa pero hace decrecer 
a x, y xs de modo que siendo xı = 2 obtenemos x4=0 y xs = 
= 3 > 0. De este modo la variable x, debe hacerse libre lo que 
nos lleva a una nueva base xı, Xa, Xs- 

Para continuar la resolución, solucionaremos el sistema q) 
respecto a las nuevas variables de base, reduciéndolo a la forma 


x3=6+ 3x2 — 2x3 
xs = 3 — 3x2 + xa 


x =2 4 2x9 — Xa 
} (7-25) 
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Asimismo expresaremos la función de objetivo por medio de las 
nuevas variables libres xz y x: 


4 =2+%—* (7-26) 


Repitiendo los razonamientos anteriores llegamos a deducir que 
no se ha alcanzado el máximo de la función de objetivo y hay que 
pasar la variable libre xo a la de base y la variable de base xs, a la 
libre. Con esto, las variables xı, xa, xa forman una nueva base. 

Resolviendo las ecuaciones (7-20) respecto de las nuevas va- 
riables de base, obtenemos: 


1 2 
== GU — As 


tidad can 


Ly =9—x4— xs 
La función de objetivo toma entonces la forma: 
Y =3-Íx1— iss. (7-28) 


En la expresión (7-28) vemos que, al aumentar las variables 
libres x4 y xs, disminuye el valor de g. Por tanto, con la base dada 
se alcanza el máximo de la función de objetivo g' y la solución del 
problema considerado será la colección de variables siguientes: 


4=x%=0 x=4 n=l, 4=9. 


Con esto g’ = — q4 = 3, q = — 3. 

El método de resolución del problema de programación lineal 
estudiado posee la deficiencia de que acarrea voluminosas trans- 
formaciones de una forma a otra del sistema de ecuaciones linea- 
les. Puede lograrse una considerable simplificación de las trans- 
formaciones si presentamos las ecuaciones en forma de tablas que 
contengan los coeficientes de las variables. Con esto, el paso de un 
sistema de ecuaciones al otro se reduce a calcular nuevamente los 
coeficientes en las tablas lo que se realiza según reglas puramente 
formales que, además, están bien adaptadas para resolverlas con 
calculadoras electrónicas. 


b) Método tabular de búsqueda de la solución óptima 


Al emplear el método tabular es conveniente introducir una 
forma especial de notación para la ecuación (7-1) y la función de 
objetivo (7-2). Designemos por x, i= l, ..., m las variables de 
base y por x7, j = 1, ..., (n — m), las variables libres. Habiendo 
expresado la función de objetivo y las variables de base por medio 
de variables libres, enunciaremos el problema de programación 
lineal de la suerte siguiente: 
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maximizar 
non 


d=-9=00 È 00) (7-29) 
a condiciones de que 
“=a È ah id m 
g>% x(>0 (7-30) 


Con tal forma de notación el problema puede representarse me- 
diante la siguiente matriz de cocficientes de las variables: 


= a 


q |a o in=m) 
Xi hatua ee Crin f, (1-31) 
Xn | Onam + amm) 


Por el aspecto de los coeficientes de la matriz (7-31) es fácil 
juzgar si es admisible la solución de base hallada y, en caso de ser 
admisible, si será o no óptima. En efecto, advirtiendo que la co- 
lumna de coeficientes œm, i20 representa la solución de base 
correspondiente a la base x, ..., Xm y la línea de coeficientes 


aos j0, los coeficientes de variables libres en la expresión 
para q’ tomados con el signo opuesto, llegamos a la conclusión de 
que la solución de base correspondiente a la base xj, ..., Xm es 
admisible si œo > 0, i + 0. Si, además, ao > 0, j 52 0, esta solu- 
ción de base es asimismo la óptima. También, es evidente que con 
la solución de base óptima el coeficiente æo brinda el valor q = 
ia =— Imin 

Comencemos la solución del problema buscando cualquier solu- 
ción de base admisible que no sea óptima en caso general. Repre- 
sentemos esta solución de base mediante la tabla de coeficientes 
compilada a modo de la matriz (7-31). Para el paso a la mejor 
solución de base es necesario transformar la matriz de los coefi- 
cientes. El método de esta transformación se formulará a manera 
de sistema de reglas que ilustraremos con el ejemplo del problema 
resuelto en el párrafo anterior. No vamos a dar una demostración 
rigurosa a estas reglas. Sólo hacemos hincapié en que ellas corres- 
ponden exactamente a aquellas transformaciones del sistema de 
ecuaciones que se realizaron en el ejemplo precedente y pueden 
comprobarse fácilmente comparando las transformaciones corres- 
pondientes. 

Supongamos que el problema de programación lineal está plan- 
teado en forma del sistema de ecuaciones (7-20) y de la función 
de objetivo (7-22) que hace falta maximizar, Tomando x y xz como 
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variables libres, reducimos este sistema de ecuaciones y la función 
de objetivo a las formas (7-29) y (7-30): 


q =0 — (— x + x: 
x=2—(—2x, +x. 
x= 2 — (x, — 2x2); 
X= 5 — (x; + x2). 

Representemos la matriz de los coeficientes en forma de la 
tabla 7-2,a con cuadros de dimensiones suficientemente grandes, 


en cuyo ángulo superior izquierdo anotaremos los coeficientes aiy 
de las ecuaciones (7-32). 


(7-32) 


Tabla 7-2 
Transformaciones consecutivas de las tablas de coeficientes al resolver 
un problema de programación lineal 


=> 
als jale CE 
o [e fi à je = 
a Y : CS EN E 
2 1 — $ | 3 
e |2 f- 
xa a oja 1 
3 1 
2 1 —2 1 2 
z Ja a A B 
3 3 
5 
3 
| 1 al a OS 
e) 


Comprobemos si no se ha encontrado ya la solución óptima 
cuya condición es æo; > 0, j 0. Por cuanto «o (coeficiente de 
—xı en la expresión para q’) es negativo, la solución óptima no se 
ha encontrado y la variable x, debe hacerse variable de base, Des- 
taquemos la columna correspondiente a la variable x, por medio de 
rayas dobles. Si los coeficientes «o, de algunas variables libres 
resultan negativos entonces puede convertirse en variable de base 
cualquiera de ellas. 


Determinemos ahora cuál de tas variables de base debe hacerse 
libre. Evidentemente aquella que con más prontitud se vuelve cero 
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al aumentar xı. Esta será la variable de base x; para la cual el 
coeficiente en la columna marcada «n > 0 y la relación aj/an es 
la menor. Dicha variable es la de base x; con a = 2 y oa = 1 
También marcaremos con líneas dobles la fila correspondiente a la 
variable de base xa. 

Llamaremos coeficiente general al coeficiente à = an que se 
encuentra en el ángulo superior izquierdo del cuadro en la inter- 
sección de la fila y la columna marcadas. En nuestro caso A == l 
(encerrado en un marco). 

Ahora deben llenarse los ángulos inferiores de cada cuadro. Lo 
hacemos según las reglas siguientes: 

1) en el cuadro, en la intersección de la fila y la columna mar- 
cadas escribimos 1/2; 

2) en los cuadros de la fila marcada escribimos los coeficientes 
superiores, multiplicados por ?. (los coeficientes superiores a excep- 
ción del coeficiente general se distinguen con tipos gruesos); 

3) en los cuadros de ła columna marcada escribimos los coefi- 
cientes superiores multiplicados por —-. (los coeficientes inferiores 
a excepción del cuadro con el cocficiente general se distinguen con 
tipos gruesos); 

4) en los cuadros restantes escribimos el producto de los coefi- 
cientes distinguidos con tipos gruesos en cuya intersección se en- 
cuentra el cuadro dado, 

Después pasamos a llenar la tabla 7-2, b, que difiere de la 7-2, a 
en que la variable libre marcada con x, se convierte en variable 
de base y la variable de base marcada con x4 se volvió libre. Los 
ángulos superiores izquierdos de los cuadros de la tabla 7-2, b se 
llenan según las reglas siguientes: 

1) la fila y la columna correspondientes a las nuevas variables 
libre y de base se llenan con los coeficientes inferiores de la fila 
y la columna marcadas de la tabla 7-2, a; 

2) en los cuadros restantes se anotan las sumas de los coefi- 
entes quese hallan en los cuadros correspondientes de la ta- 

a 7-2, a. 

La tabla 7-2, b tlenada de esta forma corresponde a la matriz 
de los coeficientes (7-31) con la nueva base xı, xa, xs. En lo suce- 
sivo se repite todo el proceso. 

Por cuanto en la tabla 7-2, b el coeficiente ag < 0, no se ha 
encontrado la solución óptima. Luego, según las reglas enunciadas 
es necesario llenar los ángulos inferiores izquierdos de la ta- 
bla 7-2, b y pasar a la nueva tabla 7-2, c que corresponde a la base 
xi, Xa xa En esta tabla los coeficientes mo; ¡20 son positivos 
y ella brinda la solución óptima del problema que hallamos en la 
columna de los miembros libres: 


n=4 n=l x=% =n 


Amáx = — Imn 3 Gan =— 3. 


c) Problema dual de programación lineal 


Volvamos al problema de distribución de recursos examinado 
en el ejemplo 7-1 y preguntémonos cuál es, desde el punto de vista 
de la empresa, el valor de los recursos existentes a su disposición. 
Al solucionar esta cuestión vamos a tener en cuenta que los recur- 
sos que la empresa no puede utilizar por completo tienen para ella 
un valor muy bajo en el sentido de que ta misma no va a estar de 
acuerdo en sufragar incluso gastos pequeños para aumentar las 
reservas de dichos recursos. Así pues, el equipo costoso que no se 
utiliza en el proceso tecnológico posee valor nulo para la empresa. 
Evidentemente tendrán el mayor valor los recursos que limitan en 
mayor grado la producción y, por ende, los ingresos de la empresa 
en el aumerto de las reservas de cuyos recursos la empresa está 
dispuesta a sufragar gastos considerables. 

Por eso puede considerarse que cada tipo de recurso posee 
cierto “precio oculto” que determina el valor de! recurso dado para 
la empresa desde el punto de vista de los ingresos por la realiza- 
ción de la producción y que depende de la reserva existente de este 
recurso y de las necesidades de él para realizar la producción. 

Si la empresa, por motivos cualesquiera, se limita a un solo 
proceso tecnológico que requiere grandes gastos de cierto recurso 
cuyas reservas están limitadas, el precio oculto de este recurso 
será alto. No obstante, los precios ocultos establecidos en concor- 
dancia con este proceso tecnológico no serán los mejores ya que la 
introducción de otros procesos tecnológicos permitirá utilizar más 
racionalmente todas las reservas de recursos. Luego, existen pre- 
cios ocultos óptimos, que corresponden a los ingresos máximos de 
la empresa, es decir, a la distribución óptima de los recursos. 
Como vemos, la determinación de los precios ocultos óptimos re- 
sulta estrechamente vinculada al problema de distribución óptima 
de los recursos, o sea, al problema de programación lineal descrito 
mediante el sistema de ecuaciones (7-8) y la función de objetivo 
(7-9). Sin embargo, para determinar los precios ocultos óptimos 
Le plantearse un problema independiente de programación li- 
neal, 

Designemos por u, el precio oculto de la unidad del recurso Si 
Las magnitudes u; deben ser tales que el precio oculto de los re- 
cursos utilizados en cualquier proceso tecnológico no sea menor 
que el ingreso obtenido. Empleando las designaciones del ejem- 
plo 7-1 y los datos de la tabla 7-1, escribiremos esta condición en 
la forma: 


2 anuer, i 


(7-33) 


Si introducimos las variables m+; > 0 que representan el ex- 
ceso del precio oculto de la unidad del producto sobre los ingresos 
debidos a su realización, el sistema de desigualdades (7-33) se 
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convierte en el de ecuaciones 


Lay ss (7-34) 


Consideraremos precios ocultos óptimos a los que minimizan el 
costo total de los recursos, es decir, la magnitud 


A 
g= Btm (1-35) 


El sistema de limitaciones (7-33) junto con la función de ob- 
jetivo (7-35) constituye un nuevo problema de programación lineal 
que recibió el nombre de problema dual respecto al del ejemplo 7-1 
ge se denomina problema directo o fundamental de programación 
ineal. 

No es difícil notar que los problemas directo y dual resultan 
estrechamente vinculados entre sí. Este vínculo se manifiesta en lo 
siguiente: 

si el problema directo es un problema de maximización de la 
función de objetivo, el problema dual lo es de minimización; 

los cocficientes de la función de objetivo en el problema directo 
son miembros libres en las limitaciones del problema dual; 

los miembros libres de las limitaciones del problema directo se 
vuelven coeficientes de la función de objetivo en el problema dual; 

los coeficientes de las variables en las limitaciones del proble- 
ma dual representan columnas de la tabla de coeficientes del pro- 
blema directo; 

los signos de las desigualdades en las limitaciones se cambian 
por los opuestos. 

Existe una estrecha relación entre las soluciones de los proble- 
mas directo y dual de programación lineal. Para establecer esta 
relación escribiremos las ecuaciones de los problemas directo y 
dual en otra forma. 


$ 
È apu—unu=en i 


En el problema directo tomaremos las variables xı, ..., x como 
libres y lo formularemos del modo siguiente: 
maximizar t 
g=0— Yie (7-36) 
a condiciones de que 
4 
tush 2 Mx imi, ..., m. (7-37) 
A este problema corresponde la matriz del tipo 
¡A AE 
q |0 —a...—<e 
Zn |b au ân (1-38) 
Xişm dbm Gmi amt 
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En el problema dual tomaremos como variables libres 41, ... 
+» um y lo formularemos de la manera siguiente: 


minimizar 
=0 X bu (7-39) 
a condiciones de que 
m 
Um ert Baun j a a (7-40) 
A este problema corresponde la matriz del tipo 
La n ti 
q E a 
Umi | — ii Gu -oe Qm (1-41) 
Umat h — Ci Qu -.. Am 


Como vemos, las columnas de la matriz (7-41) son líneas de la 
matriz (7-38). Por consiguiente, podemos describir los problemas 
directo y dual mediante una misma matriz (7-38) en la cual, no 
obstante, debe estar establecida la siguiente corronspondencia 
entre las variables directas y duales: 


Xim j=l. b ) 
Xi E y, i=l, ..., m. (142) 


Hay que recalcar que cualquier transformación de la matriz 
(7-38) según las reglas del párrafo anterior conduce a una nueva 
matriz que también va a describir tanto el problema directo como 
el dual. Por consiguiente, la matriz del tipo más general (7-31) 
puede servir para describir los problemas de programación lineal 
tanto directo como dual. Si con esto los elementos de la primera 
columna (con la excepción posible de coo) son positivos, la matriz 
corresponde a la solución de base admisible del problema directo. 
Si son positivos los elementos de la primera fila (con la excepción 
posible de æ) dicha matriz corresponde a la solución admisible 
del problema dual. Si en la matriz (7-31) son positivos los elemen- 
tos tanto de la primera columna como de la fila superior (con la 
excepción posible de æ), esta matriz corresponde a la solución 
óptima tanto del problema directo como del dual. Con esto el 
coeficiente a brinda el valor de la función de objetivo que, siendo 
óptima la solución, coincide tanto para el problema directo como 
para el problema dual: 


Finir = Imin (7-43) 


Ejemplo 7-5. El problema de distribución de los recursos está presentado en 
la tabla 7-3. En las columnas complementarias de esta tabla se da la solución 
de los problemas directo y dual de programación lineal, es decir, se indica el 
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plan óptimo de distribución de los recursos, los sobrantes de recursos con el 
plan óptimo y los precios ocultos. En la tabia se ve que tienen precio nulo los 
recursos del lipos S, que existen en exceso. Tienen el mayor precio los recursos 
S que se requieren para todos los procesos tecnológicos y cuyas reservas no 
son grandes. 

Tabla 7-3 


Datos iniciales para el problema de utilización de los recursos 


Gasto de recursos 
por unidad de Reservas | ¿SoPrantes 


Tipos de recursos producción igis de fecursos | Precios 
= A | one pion | osut 
S TE 1 25 55 o 
Sa £ 1 1 14 0 3,0 
Ss opa pa 19 o 05 
S 3 |o 1 a o 10 
Ingreso por la realiza: | 6 | 5 | 5 - =- ni 


ción de la unidad de 
producción 


Plan óptimo | ss 10 | 75 


Notemos, en coulcusión, que los precios ocultos pueden jugar un impor- 
tante papel en diversos casos como instrumento de mando. Así pues, en una 
gran empresa o rama industrial, en la que muchas decisiones se toman inde- 
pendientemente por los departamentos y grupos de producción, a veces es di- 
cil informar a cada sección sobre las decisiones tomadas por otros departamen- 
tos. En este caso los precios oculios pueden servir de buena orientación a cada 
departamento para tomar decisiones cercanas a las óptimas desde el punto de 
vista de los intereses de toda la empresa en conjunto. 


d) Concepto de programación de números enteros 


En diversos problemas de programación lineal las variables 
son magnitudes no divisibles en partes. Así, una empresa no puede 
producir 7,5 aviones, 4,8 turbinas, etc. En estos problemas se añade 
a las condiciones (7-1) y (7-2) la exigencia de que las variables xi 
se expresen por números enteros o, como en el ejemplo 7-4, sean 
elementos de un conjunto finito. Geométricamente esto significa 
que las soluciones admisibles serán no todo el dominio de solu- 
ciones admisibles definido por las limitaciones (7-1), sino única- 
mente algunos puntos descritos de este dominio, como se muestra 
en la figura 7-3. 

Desde luego, puede intentarse resolver un problema similar sin 
tomar en cuenta la condición de que sean enteros los números 
y hallar la solución determinada en la figura 7-3 por el punto /, 
y después redondear esta solución hasta los números enteros más 
próximos obteniendo' de este modo, en calidad de solución de nú- 
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meros enteros, el número 2. embargo, con esto puede obtenerse 
una solución que está muy lejos de ser óptima. Asi, en la figura 7-3 
el punto 3 va a servir de solución óptima de números enteros, 

Existen diversos métodos de solución del problema de progra- 
mación de números enteros de los cuales el más difundido es el 
método de Homory. Sin detenernos en el aspecto de cálculo del 
método de Homory indiquemos solamente 
la idea general de dicho método. 

E! método de Homory está basado en 
el empleo del método símplex, con ayuda 
del cual se busca la solución óptima que 
7 no toma en consideración que las varia- 
bles sean de números enteros o de carácter 
$ discreto. Si esta solución resultó de núme- 
rÀ ros no enteros, se introduce una limitación 

o I 2 3 4 3 adicional que geométricamente repre- 
Fig. 7-3. Conjunto de so- Senta la línea ab en la figura 7-2 la cual 
Juciones admisibles en el Secciona una parte del dominio de solucio- 
problema de programa- nes admisibles junto con la solución óp- 
ción de números enteros {ima obtenida que no contiene ningún pun- 

to admisible de números enteros. Con esta 
limitación adicional la solución óptima hallada se encuentra fuera 
del nuevo dominio de soluciones admisibles, es decir, será inad- 
misible. Por eso el problema se resuelve de nuevo por el método 
símplex y se halla la solución óptima ya para el nuevo dominio de 
soluciones admisibles. Si esta nueva solución otra vez no es de 
números enteros, se repite el proceso. 

En los últimos tiempos para resolver el problema de programa- 
ción de números enteros se eplean con éxito métodos combinatorios 


entre los cuales el más importante es el método de las ramas y los 
límites. 


G 
al 
3 
2 
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PROBLEMAS PARA EL CAPITULO 7 


7:1; Iransformar las desigualdades (7-10) en ecuaciones, ¿Cuál es el signifi- 
cado físico de las variables añadidas al hacerlo? 

7-2. Determinar con ayuda del método simplex el plan óptimo de distri- 
bución de los recursos por los datos del ejemplo 7-5, habiendo tomado como 
variables libres en la etapa inicial xı, xa y xa 

7:3. Resolver por el método simplex el probiema dual por los datos del 
ejemplo 7-5 habiendo tomado como variables libres en la etapa inicial 4, ta, us 
y ur. Comparar la matriz correspondiente a la solución óptima con la matriz 
respectiva, dada en el problema 7-2. 


Capítulo octavo 
TEORIA DE LOS JUEGOS 


8-1. OBJETO DE LA TEORIA DE LOS JUEGOS 


a) Juego como modelo de una situación de conflicto 


La teoría de los juegos representa una disciplina matemática 
que se desarrolla intensamente, el objeto de cuyas investigaciones 
son los métodos de toma de decisión en las llamadas situaciones 
de conílicto. La situación se llama de conflicto si en ella chocan 
los intereses de varias (habitualmente dos) personas que persiguen 
objetivos opuestos. Cada una de las partes puede tomar una serie 
de medidas para alcanzar sus objetivos, con esto( el éxito de una 
parte significa el fracaso de la otra. 

Los autores del primer tratado fundamental sobre la teoría de 
los juegos, J. von Neumann y O. Morgenstern, se orientaron al 
análisis de las situaciones de conflicto en las cuestiones de econo- 
mía cuando, existiendo competencia libre, juegan los papeles de 
partes en lucha firmas comerciales, empresas industriales, etc. Sin 
embargo, las situaciones de conflicto se presentan en otras muchas 
esferas. Se catalogan entre las situaciones de conflicto casi todas 
las que surgen durante la planificación de operaciones militares, 
elección del sistema de armamento, protección de los objetos contra 
ataques, persecución e intercepción dé un objetivo, etc. Son ejem- 
plos interesantes de situaciones de conílicto las competiciones de- 
portivas, discusiones de arbitraje, subastas y elecciones al parla- 
mento en caso de haber varios candidatos para un puesto. 

Los ejemplos presentados indican la gran variedad de situacio- 
nes de conflicto que se encuentran en la práctica. Corrientemente 
esas situaciones son de difícil análisis directo a cuasa de la mul- 
titud de factores secundarios acompañantes. Para hacer posible el 
análisis matemático de una situación de conflicto es necesario 
simplificarla, tomando en consideración solamente los factores bá- 
sicos, El modelo simplificado y formalizado de una situación de 
conílicto se denomina juego y las partes en conílicto (contrincan- 
les), jugadores. Nos limitaremos a estudiar los juegos en los que 
sólo hay partes en conflicto. Antes de dar la definición formal de 
juego, es necesario aclarar la terminología utilizada que coincide 
en principo con la que se encuentra en diversos juegos de entrete- 
nimiento y azar (ajedrez, damas, juegos de cartas, etc.). 

Hay que distinguir el concepto de juego y el de partida indivi- 
dual de este juego. El juego representa la colección de reglas que 
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describen el comportamiento de los jugadores. Cada caso en que 
se juega un juego de alguna forma concreta, de principio a fin, 
constituye una partida del juego. Los elementos del juego son las 
jugadas. Las reglas del juego determinan cuál debe ser la secuen- 
cia de las jugadas e indican el carácter de cada jugada. 

Las jugadas pueden ser personales y aleatorias. La jugada per- 
sonal es la elección por el jugador de una de las variantes de un 
conjunto preasignado. Por ejemplo, cada jugada de ajedrez es una 
jugada Ti siendo la primera la elección entre 20 variantes. 

a decisión tomada por el jugador para la jugada personal se 
llama elección. 

La jugada aleatoria es también la elección de una de las va- 
riantes de un conjunto, pero aquí la variante no se elige por el 
jugador sino por cierto mecanismo de elección aleatoria. Pueden 
servir de ejemplos de jugadas aleatorias el reparto de cartas o el 
lanzamiento de una moneda. La elección realizada durante la ju- 
gada aleatoria se denomina resultado de esta jugada. 

Con respecto a las jugadas las reglas tienen la siguiente 
estructura. . 

Para la primera jugada las reglas indican si ésta es una ju- 
gada personal o aleatoria. Si es la jugada personal, ellas enume- 
ran las variantes existentes e indican cuál jugador debe hacer la 
elección. Si es una jugada aleatoria, enumeran las variantes exis- 
tentes y condicionan las probabilidades de su elección. 

Para cada jugada siguiente las reglas determinan según las 
elecciones y los resultados de las jugadas anteriores: 

si va a ser esta jugada personal o aleatoria; 

si la jugada va a ser aleatoria, las variantes que se presentan 
y las probabilidades de su elección; 

si la jugada va a ser personal, cuál jugador realiza la elección, 
las variantes posibles entre las cuales se realiza la elección y Ja 
información con respecto a las elecciones y los resultados de las 
jugadas anteriores. 

Por último, las reglas determinan según las elecciones y los 
resultados de las jugadas que se suceden una tras otra (es decir, 
en dependencia de la marcha del juego), cuándo debe terminar el 
juego y cuáles son las ganancias o pérdidas de cada jugador. 


b) Concepto de estrategia 


Imaginémonos que queremos jugar una partida de ajedrez con 
las blancas pero no podemos estar presentes personalmente duran- 
te el juego. Tenemos un sustituto que debe desarrollar la partida 
y cumplir todas nuestras indicaciones. Pero él no sabe jugar al 
ajedrez y no es capaz de tomar decisiones independientes. Para 
que el sustituto pueda desarrollar toda la partida hasta el final, 
deben dársele tales indicaciones que prevean cualesquier posiciones 
posibles en el tablero y determinen para cada posición la jugada 
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que debe hacerse, El sistema completo de estas indicaciones es la 
estrategia. 

Así, la estrategia de las blancas debe indicar la primera juga- 
da, y después para cada respuesta de las negras, la siguiente 
jugada de las blancas, ete. Por supuesto, la compilación de la 
estrategia completa durante el juego de ajedrez es un trabajo 
enorme, prácticamente irrealizable. Por ejemplo, el jugador con las 
blancas que está presente en persona, debe tomar dos decisiones 
para hacer dos primeras jugadas. Ahora, jugando con ayuda del 
sustituto él debe preparar 21 decisiones para aquellas mismas dos 
jugadas (una decisión, primera jugada y 20 decisiones, respuestas 
a las 20 primeras jugadas posibles de las negras). No obstante, 
en muchos problemas más sencillos el concepto de estrategia es 
sumamente útil. 

De esta suerte, la estrategia del jugador constituye la descrip- 
ción unívoca de su elección en cada situación posible en la que él 
debe hacer una jugada personal. 

Si el juego consta solamente de jugadas personales, su resul- 
tado está determinado si cada uno de tos jugadores eligió su estra- 
tegia. Sin embargo, si en el juego hay jugadas aleatorias, entonces 
él va a tener carácter probabilístico y la elección de la estrategia 
de los jugadores todavía no determinará definitivamente su resul- 
tado. 


c) Descripción formal del juego de dos personas 


Designemos por X e Y los conjuntos o espacios de todas las 
estrategias posibles que pueden utilizar los participantes del juego 
que en lo sucesivo se denominarán, o primer y se- 
gundo jugadores. Las magnitudes x= X e y E Y van a significar 
las estrategias concretas del primer y segundo jugadores. 

Para introducir en el análisis las jugadas aleatorias es cómodo 
considerar que toma parte en el juego un tercer jugador que hace 
las jugadas aleatorias utilizando para ello el correspondiente meca- 
nismo de elección aleatoria. Designemos por H el espacio de estra- 
tegias de este jugador. Cualquier estrategia A e H del tercer juga- 
dor que representa la secuencia concreta de todas las jugadas 
aleatorias en la partida ocurrirá con cierta probabilidad p(h) que 
no es dificil de calcular conociendo las probabilidades de cada 
jugada aleatoria en esta secuencia. Es fácil ver que p(h) repre- 
senta la distribución de probabilidades en el espacio H, es decir, 
satisface las condiciones 


p> Y pm=1 (8-1) 
nEn 


Designemos por g cierta variante del juego, es decir, una par- 
tida posible. Esta variante estará determinada si se han elegido 
las estrategias de los jugadores x e y y las de las jugadas aleato- 
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rias h. Por consiguiente, la partida concreta g representa ta tríada 
de magnitudes x, y, h: 


g= (x, y, h). (8-2) 


El resultado de la partida son la ganancia o pérdida de cada 
uno de los jugadores. Para más comodidad vamos a estimar las 
ganancias y pérdidas con algún número, por ejemplo, con una 
suma de dinero en rublos. 

Examinemos una de las partidas concretas g(x, y, h) y designe- 
mos por L(x, y, h) y Ly(x, y, h) las ganancias o pérdidas-del pri- 
mero y segundo jugadores, respectivamente. Al hacerlo, considera- 
mos las ganancias como pérdias negativas. La suma total de 
pérdidas de ambos jugadores es igual a: 


L(x, y, h) + Ly lx, y, h). (8-3) 


En lo sucesivo nos limitaremos a examinar solamente los Ila- 
mados juegos con suma nula, es decir, los juegos cuya suma total 
de pérdidas (8-3) es igual a cero. En tales juegos la pérdida de un 
jugador es igual a la ganancia del otro. 

Al estudiar los juegos con suma nula no hay necesidad de con- 
tar por separado las pérdidas o ganancias de ambos jugadores 
y podemos limitarnos a contar solamente la pérdida del segundo 
jugador (la ganancia del primer jugador): 


Lyle, y, h)=— Lx (x, y, h) = L(x, y, h). (8-4) 


Por cuanto la estrategia h es aleatoria, con las estrategias ele- 
gidas x e y las pérdidas L(x, y, h) serán una magnitud aleatoria 
con la distribución de probabilidades p(A) en el espacio H. Por eso 
únicamente pueden estimarse las estrategias elegidas x e y to- 
mando la medida de las pérdidas L(x, y, h) por todo el espacio H, 
es decir, introduciendo el concepto de pérdidas medias L(x, y) de- 
terminadas según (5-64) por la correlación 


Li, u= 2, Lt v Mp. (8-5) 


El juego estará determinado si están enumeradas todas las 
estrategias posibles de los jugadores, es decir, están presentados 
los espacios X e Y y determinadas las pérdidas L(x, y) para x E X 
e y = Y cualesquiera. De este modo llegamos a la siguiente defini- 
ción formal de juego. 

El juego G se define por la tríada 


G=(X, Y, L), (8-6) 


donde X e Y representan cierto espacio y L es una función numé- 
rica limitada definida en el producto directo X X Y. Los puntos 
xEX e ye Y se denominan estrategias del primero y segundo 
jugadores y la función Ł se llama función de pérdidas. 
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Es cómodo presentar los juegos, en los cuales cada jugador 
tiene un número finito de estrategias (juegos finitos), en forma de 
la llamada matriz de pérdidas. Sea G =(X, Y, L) un juego finito 
en el que X == (Xi, ..., Xm) e Y = (Yu .-., yn). Entonces la matriz 
de orden m X n 

qm o. Gin | 


amta=|* > (8-7) 


Gm ==> Ima 


en la que qy = L(x;, yy) se denomina matriz del juego G. 

Para que la descripción del juego esté terminada hay que se- 
ñalar los objetivos por los cuales se guían los jugadores al elegir 
sus estrategias. Estos objetivos son lo suficientemente sencillos. 
El primer jugador trata de asegurarse la mayor ganancia, o sea, 
de maximizar la función L(x, y) y el segundo jugador trata de 
hacer mínima su pérdida, es decir, de minimizar la función Ł (x, y). 
De este modo, los objetivos de los jugadores resultan directamente 
opuestos, La dificultad específica con esto es el hecho de que 
ninguno de los jugadores controla por completo el valor L(x, y) 
ya que el primer jugador sólo dispone del valor de x, y el segundo, 
solamente del valor de y. La superación de esta dificultad, o sea, 
la determinación por cada uno de los jugadores del método más 
racional para desarrollar el juego, constituye la esencia de la teo- 
ria de los juegos. 

Es necesario recalcar que los razonamientos expuestos sóło son 
ciertos para un juego de dos personas con suma nuta, Si el número 
de jugadores es mayor de dos, surge una situación completamente 
diferente cuya particularidad consiste en que algunos de los juga- 
dores pueden mancomunar sus acciones formando coaliciones con 
distribución de las ganancias por acuerdo entre los participantes 
de la coalición. Los participantes de la coalición pueden estimar 
sus posibilidades con más plenitud y efectuar acciones coordinadas 
asegurándose así la ganancia más cuantiosa. 

tra variante de juego es el juego con suma no nula. En este 
juego las ganancias de unos jugadores pueden obtenerse no sola- 
mente a cuenta de las ganancias de otros sino también a base de 
pagos cualesquiera recibidos del exterior. Estos pagos pueden con- 
siderarse como pérdidas de cierto jugador adicional ficticio, lo que 
permite reducir el juego de n personas con suma no nula al juego 
de n + 1 personas con suma nula. 

Sin embargo, la teoría de los juegos con n participantes para 
n > 2 es bastante compleja y está insuficientemente investigada. 
Por eso nos limitaremos solamente al estudio del juego de dos 
personas con suma nula. 

Ejemplo 8-1. Para aclarar los conceptos introducidos, examinemos el juego 
siguiente que consta de cuatro jugadas. 


Primera jugada (personal). El primer jugador elige uno de los dos números 
enteros 1, 2. 
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Segunda jugada (aleatoria). Se lanza una moneda y si cae de escudo 
(y sólo en este caso), se comunica al segundo jugador lo elegido por el primero. 

Tercera jugada (personal). El segundo jugador elige uno de los dos núme- 
ros enteros 3, 4. 

Cuarta jugada (aleatoria). Se elige de forma aleatoria, con probabilidades 
0,4; 0,2; 0,4 uno de los tres números enteros |, 2, 3. 

Resultado del juego: se adicionan los números, elegidos en la primera, ter- 
cera y cuarta jugadas y la suma obtenida se paga por el segundo jugador al 
primero, si ella es par y por el primer jugador al segundo, si es impar. 


Durante el análisis preliminar es cómodo representar el juego 
en forma de árbol en el cual las posiciones que surgen en el pro- 
ceso del juego se representan por vértices y las jugadas, por ra- 
mas que unen un vértice con otro. En la figura 8-1 se muestra el 


. 9-8 7-8 7-6 
Perdida RPP RG 
Y 327 321 
Cuarta juga- 
dao y 


Segunda jugada Y 


Primera jugada 


Fig. 8-1 Arbol de juego 


árbol del juego considerado. Los vértices correspondientes a las 
jugadas personales del primero y segundo jugadores, se designan 
respectivamente por 7 y //. Los vértices correspondientes a las 
jugadas aleatorias se designan por O. Los vértices finales que de- 
terminan las variantes aisladas del juego están marcadas con 
cifras que significan las pérdidas del segundo jugador. 

En los diferentes vértices correspondientes a las jugadas per- 
sonales, el jugador posee un tipo determinado de información sobre 
las jugadas precedentes. Si en varios vértices éste tiene acceso 
a una misma información, es conveniente reunir estos vértices, 
Mediante esta reunión se obtienen grupos de vértices S; denomina- 
dos clases de información. En el ejemplo examinado hay cuatro 
clases de información cuyo contenido es el siguiente: 

Sı, todavía no ha habido jugadas, el primer jugador debe hacer 
la primera jugada; 

Sa, el primer jugador eligió 1; 

Sy, el primer jugador eligió 2; 

S., no se sabe qué eligió el primer jugador. 
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Al alcanzar al vértice que se halla en la clase S,, el segundo 
jugador no tiene información sobre la elección hecha por el primer 
jugador. Dicho juego se denomina juego con información incom- 
pleta. Si forma parte de la clase de información sólo un vértice, el 
jugador que alcanza este vértice está completamente informado 
sobre todas las jugadas anteriores (él puede obtener esta informa- 
ción, por ejemplo, siguiendo por el árbol del juego el camino hasta 
el vértice dado), o sea, dispone de toda la información sobre el 
juego. Los juegos en los que cada clase de información contiene 
sólo un vértice se denominan juegos con información completa 
(ajedrez, damas, dominó, el 

Examinemos el espacio de estrategias de los jugadores. Descri- 
bamos con la tabla 8-1, a el espacio de estrategias del primer juga- 
dor que consta sólo de dos elementos, a los cuales corresponde la 


Tabla 8-1 
Espacio de estrategias para el Juego en el 
ejemplo 8-1 
E 
u) | (2) 
a) 
«Aaa ll 


(333) | (334) | (343) | (344) | (433) | (434) | (443) | (444) 


b) 
pih) | 0,2 | UN] | 9,2 | 0,2 | ot | 0,2 
e) 


elección 1 ó 2. La estrategia del segundo jugador debe indicar su 
jugada con cualquier variante posible de juego. La variante de 
juego se determina por la clase de información del jugador. Para 
el segundo jugador hay tres clases de información: Sa Sy, Sy. 
Luego, la estrategia del segundo jugador consiste en indicar cuál 
de los dos número, 3 ó 4, él elige en cada clase de información. 
Asi pues, la estrategia (4, 3, 3) significa que el segundo jugador 


245 


elige el 4 en la clase de información S3 y 3, en las clases de infor- 
mación Ss y S4. El espacio de estrategias del segundo jugador se 
presenta en la tabla 8-1, b. 

Las estrategias aleatorias h constan de dos jugadas: la se- 
gunda es la elección J o P con probabilidades 0,5; 0,5 y la cuarta, 
la elección del número 1, 2 ó 3 con probabilidades 0,4; 0;2; 0,4. La 
probabilidad de cada estrategia es igual al producto de las proba- 
bilidades de los resultados de ambas jugadas. En la tabla 8-1, c 
se ofrecen el espacio de las estrategias aleatorias H y la distribu- 
ción de las probabilidades p(h). 

Para componer la matriz de pérdidas hay que determinar las 
pérdidas qi; = L(x, y;) las que en concordancia con (8-5) serán 
iguales a: 


u= 2, Lies yy h pih), 


con esto las magnitudes L(x, ys, h) representan las cifras con las 
que están marcados los vértices terminales del árbol del juego. 

Es cómodo realizar el cálculo de las magnitudes qı; mediante 
el método tabular por analogía con la tabla 8-2 preparada para de- 
terminar qu. 


Tabla 8-2 
Cálculo de las pérdidas q,, para el juego en el 
ejemplo 8-1 
h l pih | Lixn yuh) | Liu vu Ayp ih) 
31 02 +5 +10 
1,2 ol <= —0,5 
1,3 0,2 +7 +1,4 
P.1 0,2 +5 +10 
P, 2 01 —6 —0.6 
P,3 02 +7 +A 
qu = +36 


d) Precios superior e inferior del juego 


Para comprender los principios que constituyen el fundamento 
de la elección por cada jugador de su estrategia, examinemos el 
juego con la matriz representada en la tabla 8-3. 

Supongamos que el primer jugador elige la estrategia xp. Si la 
ganancia L(x», y) va a depender de la estrategia que elige el se- 
gundo jugador, por ejemplo, con la estrategia x, las ganancias 
del primer jugador pueden ser 7, 2, 5, 1. ¿Acaso el primer jugador 
puede esperar una ganancia máxima igual a 7? Sí, en caso de que 
éste suponga que el segundo jugador elige la estrategia yı. No 
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Tabla 8-3 
Matriz del juego con punto silla 


” n n n Ac 
x 7 2 5 1 1 
xa 2 2 3 4 2 
xs 5 3 4 4 3 
x 3 2 1 s |i 
B(w) | 7 w 6 | 


obstante, el segundo jugador puede elegir cualquier otra estrate- 
gia, incluso y, y entonces la ganancia del primer jugador será 
igual a 1. Pero ella no puede ser menor de 1 con ninguna estra- 
tegia del segundo jugador. Por eso 1, que es el menor elemento del 
conjunto L(x, y) = (7, 2, 5, 1), representa la ganancia garantizada 
dei primer jugador con la estrategia xı. 

Beneralizando los razonamientos expuestos vemos que si el 
primer jugador emplea la estrategia x+ asegura una ganancia 
garantizada A(xa) igual al menor elemento del conjunto Å (xa, y): 


A (xy) = min L (xz, y). (8-8) 
y 


En la teoría de los juegos se supone que los jugadores obran 
con suficiente cuidado evitando el riesgo fundado: En este caso 
el primer jugador dehe elegir la estrategia x  X que corresponde 
al mayor de los números A(x). Designando la ganancia garanti- 
zada del primer jugador por æ y llamándola precio puro inferior 
del juego, obtenemos: 


a= máx A (x)= máx mín L (x, y). 8-9) 
f} y 


Los valores A(x), correspondientes al juego con matriz del 
tipo de la tabla 8-3 se dan en la columna extrema derecha. El va- 
lor de a está marcado en esta columna con un asterisco. 

Pueden realizarse razonamientos análogos con respecto al se- 
gundo jugador, Pero en la matriz del juego se indican sus pérdi- 
das, las que él trata de hacer mínimas. Examinemos la estrate- 
gia ya» Esta estrategia puede proporcionarle una pérdida no 
mayor de 

Š Blu) = máx L (x, y. (8-10) 


Para asegurarse la pérdida de la menor magnitud, el segundo 
jugador debe emplear la estrategia y = Y que corresponde al me- 
nor de los números B(y). Designando la magnitud de la périda, 
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a la cual puede limitarse el segundo jugador, por f y llamándola 
precio puro superior del juego, obtenemos: 


B= mín B (y) =mín máx L (x, y). (8-11) 
y PONES 
Los valores B(y) para el juego con matriz del tipo de la ta- 
bla 8-3 se muestran en la fila inferior de la tabla. El valor $ está 
marcado en esta línea con un asterisco. 


Teorema 8-1. Si G=(X,Y,L) es un juego, para cualquier 
xeXeyeY tiene lugar: 


ASL, Bu) y «<p. 
Demostración. Por definición, 


A (x) = min L (x, y) < L (x, y); (8-12) 

y 
B (y) = máx L (x, y) > L (x, y). (8-13) 

Luego, š 
A(9<L(x, y <B(y). (8-14) 


Como que esta correlación se cumple con x= X e y = Y cuales- 
quiera, eligiendo en calidad de x el valor para el cual A(x) = a, 
y a modo de y, el valor para el que B(y)= p, obtenemos: 


a<p. (8-15) 


Como vemos, el precio inferior del juego, es decir, la ganancia 
que puede asegurársela el primer jugador, no sobrepasa del precio 
superior del juego, o sea, de la pérdida a que puede limitarse el 
segundo jugador. 


8-2. PRECIOS Y ESTRATEGIAS OPTIMAS 
DE LOS JUEGOS 


a) Juego con punto silla 


El caso particular más sencillo del juego es el caso en que 
a = p. Designemos esta magnitud por c. Precisamente a este caso 
pertenece el juego con la matriz presentada en la tabla 8-3, donde 
a=f=3. 

En el caso dado ningún método de juego puede garantizar al 
primer jugador una ganancia mayor de B ya que precisamente el 
segundo jugador puede limitar su pérdida justamente a la mag- 
nitud f. Por otra parte, ningún método de juego puede garantizar 
al segundo jugador una pérdida menor de æ, ya que el primer 
jugador puede garantizar una ganancia æ. Luego, si = c, 
ninguna estrategia de ninguno de los jugadores puede asegurarle 
mejor resultado que c. Al mismo tiempo, cada jugador puede ga- 
rantizarse el resultado c. En otras palabras, ni el primero ni el 
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segundo jugadores tienen mejor estrategia que la que les ase- 
gura c. En este caso c se denomina precio puro del juego, y las 
estrategias de los jugadores que aseguran el resultado c se llaman 
estrategias óptimas. 

La casilla de la matriz que determina la magnitud c se deno- 
mina punto silla, ya que el valor de c es máximo de la columna 
y minimo de la fila en cuya intersección se encuentra esta magni- 
tud. Por eso el juego que tiene precio puro se denomína juego con 
punto silla. 

El juego con punto silla se llama equitativo si c = 0. Sic 40, 
el juego será inequitativo, Para hacerlo equitativo, el primer juga- 
dor debe pagarle al segundo la magnitud c antes de comenzar 
cada nueva partida, 


b) Estrategias puras y mixtas 


Si el juego no tiene punto silla, surgen dificultades en la deter- 
minación de su precio y de las estrategias óptimas de los jugado- 
res. Examinemos, por ejemplo, el juego cuya matriz se da en la 
tabla 8-4. En este juego a. =4 y 
f = 5. Por consiguiente, el primer Tabla 8-4 
ugador puede garantizarse UNA Matriz del juego sin punto silla 
ganancia igual a 4 y el segundo 
puede limitar su ganancia a la 


magnitud 5. El dominio entre a y B eo n| a 
es como si no perteneciera a nadie 
y cada jugador puede intentar FA 3 6 3 


mejorar su resultado a cuenta de 
este dominio. ¿Cuáles deben ser en 
este caso las estrategias óptimas 
de los jugadores? B (y) | se 6 | 
Si cada uno de los jugadores 

emplea la estrategia marcada con 

el asterisco (xə e yı), la ganancia del primer jugador y ta pérdida 
del segundo van a ser iguales a 5. Esto no es ventajoso para el 
segundo jugador ya que el primero gana más que los que él puede 
garantizarse. No obstante, si el segundo jugador descubre de al- 
guna forma el plan del primer jugador de intentar emplear la 
estrategia xe, aquél puede utilizar la estrategia ya y disminuir la 
ganancia del primero hasta 4. Es cierto que si el primer jugador 
adivina la idea del segundo de emplear la estrategia yo, utilizando 
la estrategia xı el primero aumentará su ganancia hasta 6. De 
esta forma surge una situación en que cada jugador debe guardar 
en secreto la estrategia que se prepara a utilizar. Pero, ¿cómo 
hacerlo? Es que si la partida se juega muchas veces y el segundo 
jugador emplea todo el tiempo la estrategia ya, el primer jugador 
pronto adivinará el pensamiento del segundo y, utilizando la estra- 
tegia xı, tendrá una ganancia adicional. Evidentemente que el sc- 
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gundo jugador debe cambiar de estrategia en cada nueva partida, 
pero debe hacerlo de manera que el primero no adivine qué estra- 
tegia utiliza en cada caso. 

Puede guardarse el secreto, si cada vez se elige la estrategia 
de manera casual, utilizando para ello cualquier mecanismo de 
elección aleatoria. Por ejemplo, el segundo jugador puede lanzar 
una moneda y utilizar la estrategia yı, si cae en escudo, e yz, si 
cae en estrella. Tal modo de actuar priva al contrincante de toda 
posibilidad de conocer por adelantado las acciones de la otra parte. 

En caso de utilizarse un mecanismo de elección aleatoria las 
ganancias y pérdidas de los jugadores serán magnitudes aleatorias. 

n este caso puede estimarse el resultado del juego por el valor 
medio de la pérdida del segundo jugador. Asi pues, si en el juego 
con matriz del tipo de la tabla 8-4 el segundo jugador utilizará las 
estrategias y, e ya de modo aleatorio con probabilidades 0,5; 0,5, el 
valor medio de su pérdida con la estrategia del primer jugador xı 
será igual a: 


Lwes = Gu + 0,5 + qiz- 0,5= 3 - 0,5 +6 - 0,5 = 4,5, 
y con la estrategia del segundo jugador xz 
Limes = Gu * 0,5 + qu: 0,5 =5 - 0,5 + 4 - 0,5 = 4,5. 


Luego, el segundo jugador puede limitar su pérdida media a la 
magnitud 4,5 independientemente de la estrategia empleada por 
el primero. 

De este modo, en diversos casos resulta racional no trazarse 
por adelantado la estrategia que debe utilizarse, sino elegir una 
u otra estrategia de manera aleatoria, fundada en el uso de algún 
mecanismo de elección aleatoria. Denominemos estrategia mixta la 
basada en la elección aleatoria, a diferencia de las estrategias tra- 
zadas por anticipado que examinemos anteriormente y que ahora 
vamor a llamar estrategias puras. 

Daremos una definición más rigurosa de las estrategias puras 
y mixtas. 

Sea G=(X, Y, L) un juego. Los espacios X = (Xx, ..., Xm} 
e Y = (Y -.., Ya) que contienen la lista de todas las estrategias 
posibles de los jugadores se denominan espacios de estrategias 
puras, y los elementos de estos espacios x= X e y = Y son estra- 
tegias puras de los jugadores. 

Para obtener una estrategia mixta el jugador debe utilizar 
cierto mecanismo de elección aleatoria (lanzamiento de una mo- 
neda, lanzamiento de un dado de juego, etc.) que tiene un número 
de resultados igual al número de estrategias puras del jugador. 

Supongamos que el mecanismo de elección aleatoria del primer 
jugador tiene m resultados que constituyen el conjunto R = 
= (r0, ..., rom). Designemos por E, ..., &™ las probabilidades 
con las que aparecen ciertos resultados del mecanismo de elección 
aleatoria. 
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La estrategia mixta del primer jugador consiste en que a cada 
resultado r € R se asigna una de las estrategias puras x = X. Con 
esto las magnitudes EU, ..., £% van a representar las probab 
dades con las cuales se utilizan las estrategias puras Xy, ..., Xm. 
El conjunto ordenado § = (E, ..., EW), cuyos elementos satisfa- 


cen las condiciones 
EM>0 Psi, (8-16) 


puede considerarse ahora corno la distribución de probabilidades 
E(x) en el espacio X, Esta distribución de probabilidades determina 
por completo cl carácter del juego del primer jugador, y se deno- 
mina su estrategia mixta correspondiente al mecanismo dado de 
elección aleatoria. 

Otro mecanismo de elección aleatoria proporciona otra distri- 
bución de probabilidades E'(x), es decir, determina otra estrategia 
mixta del primer jugador. 

En el caso general el primer jugador puede disponer de un nú- 
mero infinito de diferentes mecanismos de elección aleatoria que 
determinan todas las distribuciones de probabilidades posibles en 
el espacio de sus estrategias puras: 


ESB EM E = (E, ESO (8-17) 

Entonces, el conjunto 
Ee (tn En -.-) (8-18) 
va a representar el espacio de las estrategias mixtas del primer 


jugador. 
De suerte análoga a ésta el segundo jugador puede utilizar 
su mecanismo de elección aleatoria, que determina las probabilida- 


des n, ..., n™® con tas que van a utilizarse las estrategias puras 
Yi ---, Yn En este caso el conjunto ordenado y == (n, ..., n), 
cuyos elementos satisfacen las correlaciones 

n*o, Z=, (8-19) 


representa la distribución de probabilidades n(y) en el espacio Y 
y se llama estrategia mixta del segundo jugador. 

El segundo jugador, al igual que el primero, puede disponer de 
un número infinito de diferentes mecanismos de elección aleatoria, 
que determinan diversas distribuciones de probabilidades en el 
espacio de sus estrategias puras: 


a a h a CANA 
el total de las cuales 


> (8-20) 


H=(m. ma --.) (8-21) 
constituye el espacio de estrategias mixtas del segundo jugador. 
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c) Función de pérdidas al utilizar estrategias mixtas 


Examinemos el juego G = (X, Y, L), en el que X= {%1 ... 
s-s Xm} e Y = (Yi, --., yu) son los espacios de estrategias puras 
de los jugadores y L(x, y) representa las pérdidas del segundo 
jugador determinadas para las estrategias puras x= X e y = Y. 
En lo sucesivo vamos a denominar la función L(x, y) función de 
pérdidas. 

Supongamos ahora que los jugadores emplean estrategias mix- 
tas. Esto signilica que están presentados todos los conjuntos 
E = (En E ..) y H = [mw ma -..), cuyos elementos representan 
las estrategias mixtas de los jugadores, es decir, las diversas 
distribuciones de probabilidades E(x) y n (y) en los espacios X e Y. 
El carácter del juego estará definido, si cada jugador eligió su 
estrategia mixta ¿sE y ņ €H. Por consiguiente, en caso de 
utilizarse estrategias mixtas, deben formar parte de la definición 
del juego los conjuntos E y H en lugar de los conjuntos X e Y. 

l utilizar las estrategias mixtas cambia asimismo la magnitud 
de la pérdida del segundo jugador, o sea, la función de pérdidas. 
Por cuanto el juego adquiere carácter aleatorio, serán aleatorias 
las magnitudes de las ganancias y pérdidas de los jugadores. Por 
eso ahora «pueda bablarse únicamente de la magnitud media de la 
ganancia X o la pérdida Y que se definirá tanto por la función de 
pérdidas L(x, y) como por ła distribución de probabilidades E(x) 
y ndy) y puede hallarse por la fórmula para el valor medio de la 
función de dos variables como 


POS (8-22) 


La función de pérdidas L(E, n) debe formar parte de la defini- 
ción del juego en caso de utilizarse las estrategias mixtas. 

De este modo, en caso de ulilizarse las estrategias mixtas 
obtenemos en lugar del juego G = (X, Y, L) un nuevo juego l = 
= (E, H, L) que se llama promedio del juego G. En este juego la 
función de pérdidas L(E, n) se determina por la fórmula (8-22) 
como la media de L(x, y) con las distribuciones de probabilidades 
presentadas E(x) y ny). 

Todo lo dicho más arriba puede compendiarse en forma de las 
siguientes definiciones. 

Sea G =(X, Y, L) un juego. Supongamos que E y H determi- 
nan diferentes distribuciones de probabilidades E y n en los espa- 
cios X e Y, y L(E, n) representa el valor medio de la función de 
pérdidas. Entonces el juego 


T=(E, H, £) (8-23) 


se denomina promedio del juego G. 
Sea T = (E, H, L) el promedio del juego G = (X, Y, L). Enton- 
ces los puntos x&X e y <= Y se llaman estrategias puras en el 
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juego G, y los puntos ¿SE y n.=H se denominan estrategias 
mixtas en el juego G. 

Subrayamos que las estrategias puras pueden considerarse 
como un caso particular de estrategias mixtas. Efectivamente, la 
estrategia mixta determinada por la distribución de probabilidades 


so=( 


coincide con la estrategia pura xp y la estrategia mixta determi- 
nada por la distribución de probabilidades 
E para y=y; 
lo pr pen 
coincide con la estrategia pura y; 


1 para x=Xp 


O para xx; (6:29) 


(8-25) 


d) Precios superior e inferior del juego al utilizar 
estrategias mixtas 


Sean G = (X, Y, L) el juego y F =(E, H, L) el promedio del 
juego. 
pongamos que el primer jugador emplea la estrategia mixta 
ESP. A este jugador le interesa cuál va a ser su ganancia ga- 
rantizada, es decir, la suma mínima de ganancia que puede asegu- 
rarse con certeza, incluso si el segundo jugador utiliza su mejor 
estrategia mixta y. Con esto no se excluye el caso posible de que 
el segundo jugador emplee alguna de las estrategias puras. 
Designemos por A(E) la magnitud de ganancia asegurada del 
primer jugador con la estrategia E. Evidentemente, esto es el límite 
inferior de la función de ganancia L (E, y) con la E dada y diferen- 
tes n € ll, es decir, 
Ar(8)= mín L (E, y. (8-26) 
” 


Más adelante, al primer jugador le va a interesar elegir entre 
todas las estrategias posibles E Œ E aquella con la que su ganan- 
cia garantizada será máxima, es decir, le va a interesar el límite 
superior de la función A, (E) designado por ay, y denominada 
precio inferior del juego con las estrategias mixtas de los juga- 
dores: 


Gp =méx Ay (8) = máx mín L (5, 1). (8-27) 
h 


La estrategia para ta cual se cumple la condición (8-27) se 
denomina estrategia de minimax (a veces de maximin) del primer 
jugador y se designa por Eo. 

Supongamos ahora, que el segundo jugador eligió alguna estra- 
tegia mixta y Æ H. A este jugador le interesa, cuál será su pérdida 
máxima con la mayor estrategia £ & E del primer jugador, o sea, 
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ite superior de la función L(8, 19) con n dada y distintas 
E E E, el que se designa por Brn): 


Br (n= máxL (E, n- (8-28) 


Al segundo jugador le va a interesar la elección de tal estrate- 
gia n € H con la que su pérdida será mínima, es decir, le va a in- 
teresar el límite inferior de la función By (n) designado por Br 
y llamado precio superior del juego con estrategias mixtas de los 
jugadores: 
Br = mín Br (n) = min máx LG, n) (8-29) 
n » 


La estrategia, para la que se cumple la condición (8-29), se 
llama estrategia de minimax del segundo jugador y se designa 
por mo. 

Para facilitar los razonamientos ulteriores introduzcamos las 
siguientes designaciones para el precio inferior y superior del 
juego G = (X, Y, L) al utilizar estrategias puras: 

Ag(x)= min L(x, y) es la ganancia garantizada del primer 


jugador con la estrategia x = X; 
ag = máx As(x) es el precio inferior del juego G con estra- 
h 


tegias puras de los jugadores; 
Ba De máx Ll y) es la pérdida mayor del segundo jugador 
x 
con la estrategia y e Y; 
Ba = mín Bo (y) es el precio superior del juego G con estrate- 


gias puras de los jugadores. 
Teorema 8-2. si se tiene el juego G =(X, Y, L) y F = (E, H, L) 
es el promedio del juego G, entonces 
a) Ac = min L (E y) ] 
b) ag Sapi 
c) Br m)= máx L(x, n); (8-30) 
d) Bo È Ppi 
e) ap S Be- 


El punto a) contiene la afirmación de que, al escoger el primer 
jugador cualquier estrategia mixta, la magnitud de su ganancia 
garantizada es igual a la magnitud de la ganancia garantizada 
al utilizar el segundo jugador solamente estrategias puras. Según 
et punto b) el precio inferior del juego con estrategias mixtas del 
primer jugador no es menor que el precio inferior del juego con 
estrategias puras, o sea, existe una estrategia mixta que en todo 
caso no es peor que la estrategia pura óptima. Los puntos c) y 
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d) contienen afirmaciones análogas respecto al segundo jugador. 
El punto e) significa que el precio inferior del juego «p al utilizar 
estrategias mixtas no excede del precio superior del juego, es decir, 
al emplear las mejores estrategias mixtas la ganancia garantizada 
del primer jugador no sobrepasa de la pérdida asegurada del se: 
gundo jugador. 

Demostración. a) Como que las estrategias puras y = Y son 
un caso particular de las mixtas ņ = E, entonces L (E, y) forma 
parte como caso particular de L(E, n), es decir, constituye un sub- 
conjunto de L (E, n). Basándonos en el teorema de límite inferior 
del subconjunto (véase ei $ 1-1), tenemos: 


mín L (E, y >mínL(, n= Ar ($). (8-31) 
v 
Más adelante L(E,n) puede considerarse como la media de 


L(é, y), tomada por todas las y con la distribución de probabili- 
dades n(y). Basándonos en el teorema del valor medio (véase el 


$ 5-5), obtenemos: 
mín £ (g, YLE, n). (8-32) 


La correlación (8-32) es válida para cualquier y € H, inclusive 
con mo, para la cual L(E, no) = min L(E, ņ). De esta manera, 


mín Ll y< min L(E, 1) =Ar(E). (8-33) 


Comparando (8-31) y (8-33), nos convenceremos de la certeza 
del punto a). 
b) Comparando Ac(x)= mín L(x, y) con la magnitud Ap (E), 


la cual, fundándose en el punlo a), puede definirse también como 
Ag(x) sólo con estrategias puras y del segundo jugador y teniendo 
en cuenta que la estrategia pura x es un caso particular de la 
estrategia mixta E(x), vemos Ag(x) es el subconjunto Ar (8). Ba- 
sándonos en el teorema de límite superior del subconjunto, tene- 


mos: 
máx Acl) < nix Arte), (8-31) 


lo que demuestra el punto b). 
Los puntos c) y d) se demuestran análogamente. 
e) Por definición tenemos: 
Ar) = mi LE, MSL E n), 
Br (n) = máx L(E, >L(, n). 


Por consiguiente, 


(8-35) 


Ar (E) <L (E, n) <Br(m). (8-36) 
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Esto es válido para E y y cualesquiera, es decir, para una E con 
la cual Ar (E) =ar, y para una ņ con la que Br (n)= fr, lo 
que demuestra el punto e). 

Corolario. Mediante la comparación de los puntos b), d) y e) 
hallamos: 


ag Sar <By < Ba- (8-37) 


Fe (8-37) se infiere que si el juego G tiene precio puro, es de- 
cir, aa = Pa = c (como vimos, esto tiene lugar para los juegos 
con punto silla), entonces a, =f$p=c, o sea, el juego T, 
también tiene precio puro. Por eso la estrategia óptima en el 
juego G es asimismo óptima en el juego I. En este caso el juego T 
no debe considerarse en absoluto y las estrategias óptimas de los 
jugadores pueden hallarse por el método descrito para los Juegos 
con punto silla. 

Ahora bien, el juego T fue introducido con el objetivo de anali- 
zar aquellos juegos en los que us < fo. Surge la pregunta, no 
resulta acaso para los juegos de gran clase, que en este caso 
ap=f, =c, yla magnitud c, puede considerarse como el pre- 
cio puro del juego T. A continuación demostraremos que esto 
ocurre realmente así: el empleo de estrategias mixtas permite ha- 
llar el precio del juego y las estrategias óptimas de los jugadores 
también en este caso. Aj hacerlo, vamos a partir de la siguiente 
definición de estrategia óptima. 

Supongamos que existe el juego G = (X, Y, L) y sea r= 
= (E, H, L) el promedio del juego G. Si el juego I tiene el precio 
puro cp = ap = p, se dice, que G tiene el precio Cp y cualquier 
estrategia óptima en T, es decir, la estrategia que asegure valores 

arantizados de la ganancia del primer jugador y de la pérdida 
lel segundo, iguales a Cp, se denomina estrategia óptima en el 
juego G. No es difícil ver que si 4 = p = Cp Jas estrategias 
máximas de los jugadores Eo(x) y mo(y) serán estrategias óptimas. 

El teorema fundamental de la teoría de los juegos es el teorema 
referente a que cada juego finito tiene preclo y cada uno de los 
jugadores tiene estrategias óptimas. El mismo será demostrado en 
el párrafo siguiente. 


8-3. TEOREMA FUNDAMENTAL DE LA TEORIA 
DE LOS JUEGOS 


a) Juego S 


Puede darse una interpretación geométrica útil a los juegos 
en los cuales el primer jugador tiene un número finito de estrate- 
gias puras. Supongamos que está dado el juego G = (X, Y, L) 
con la matriz Q = || g;, ll, definida por la expresión (8-7). Rela- 
cionemos con cada y € Y el punto C en el espacio m-dimensional 


255 


cuyas coordenadas son las perdidas del segundo jugador con todas 
las estrategias puras posibles del primer jugador: 


C=I[L (Xi, 9), -s Lltm y) (8-38) 


Tomando en consideración que L(xs 43)= 4gs, y dando a y to- 
dos los valores posibles, obtendremos n puntos: 


C= (Qu -+ -r Guido +5 Ca= Gin» <--> Gmn), (8-39) 
que tienen en calidad de sus coordenadas las pérdidas dadas en 


las columnas correspondientes de la matriz de juego. El juego 
presentado por el conjunto de puntos 


4Cp -... Crd, (8-40) 


recibió el nombre de juego S. Se juega a éste del modo siguiente. 

El segundo jugador elige uno de los puntos Ce del conjunto 

(8-40), por ejemplo Cs. Independientemente de la elección del se- 
undo jugador, el primer jugador elige una coordenada del pun- 
o C;, por ejemplo la segunda. Con esto, las pérdidas del segundo 
jugador van a ser iguales al valor de la segunda coordenada del 
punto Cs, es decir, Q23. 

Como vemos, el juego S es equivalente a un juego corriente, 
por lo menos, al utilizar estrategias puras, ya que la elección de 
un punto del conjunto (8-40) es equivalente a la elección de la 
estrategia y € Y, y la de la coordenada de este punto, equivalente 
a la elección de la estrategia x € X. 

Si el número de estrategias del primer jugador es igual a dos, 
el juego S tiene una clara representación geométrica ya que los 
puntos del conjunto (8-40) serán en este caso puntos del plano. 

Ejemplo 8-2. Examinemos el juego con la matriz definida por la tabla, 8.5. 
El juego S equivalente contiene cinco puntos: Ci se (1,0), Ca = (2,3), 
Ca = (1,1), Ca = (0,—1), Cs = (1,2). La representación geométrica de este 
juego se muestra en la figura 8-2. 


LarL(zay) 


LL) 


Fig. 8-2. Representación geométrica del juego S 


Designemos por S* la envoltura convexa del conjunto finito de 
puntos (Ci, ..., Cn) y demostremos el teorema, del cual se infiere 
que el juego S es equivalente a un juego corriente al utilizar estra- 
tegias no sólo puras sino mixtas. 
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x 1 2 — 1 
% o 3 1 = 2 


Teorema 8-3. Cualquier estrategia mixta del segundo jugador 
puede representarse por un punto perteneciente a la envoltura con- 
vexa S* y, a la inversa, cualquier punto S œ S* puede considerarse 
como cierta estrategia mixta del segundo jugador. 

Demostracion. Examinemos las estrategias mixtas de los juga- 
dores § = ($0, ..., EM) y y =(m0,..., 90). Las pérdidas del 
segundo jugador, al utilizar los datos de las estrategias mixtas, 
serán iguales a: 


LE DSZ on = 80 E quh EEOSO, (8-41) 
donde 


SP = Equal. (8-42) 
Designemos pu: S el punto en el espacio m-dimensional con las 
coordenadas S, ..., St), en el que, según (8-42), 
Mæ" o nn 
Pa e ME A Ka (8-43) 
S= GaN 4 H Gma ™. 
Teniendo en cuenta que (Qis ..., Gmi) = Ci, podemos escribir 
la expresión (8-43) en forma de correlación vectorial 
S=Cg +... + C= E Ca. (8-44) 


Tomando en consideración que las magnitudes n satisfacen 
las correlaciones (8-19), vemos que S no es otra cosa que la media 


ponderada de los puntos Ci, ..., Cn con pesos n®, ..., n™ y, con- 
secuentemente, S es cierto punto perteneciente a la envoltura con- 
vexa S*. De esta manera, a cada estrategia y = (m, ..., y) del 


segundo jugador va a corresponder cierto punto perteneciente a la 
envoltura convexa S* y la presentación de este punto es equivalente 
a la presentación de la estrategia mixta del segundo jugador. 

Se cumple asimismo lo inverso. Por cuanto cualquier punto S, 
perteneciente a la envoltura convexa S* puede representarse como 
la media ponderada de los puntos Ci, ..., Cn, que determinan la 
envoltura convexa S*, o sea, está representada en forma de la ex- 
presión (8-44), para cada punto S e S* se hallarán pesos n, ... 
+.. nó) cuya presentación determinará la estrategia mixta del se- 
gundo jugador, 


258 


Corolario. Por cuanto la estrategia mixta del primer jugador 
en el juego S se mantiene igual que en un juego corriente, del 
teorema demostrado se deduce que el juego Se completamente 
equivalente al juego corriente, es decir, cualquier juego puede re- 
presentarse en forma del juego S equivalente. 

En lo sucesivo vamos a designar por F; el juego S. Para pasar 
del juego T(E,H,£) al S, en lugar del espacio de estrategias 
mixtas del segundo jugador H =(m;, ns, ...) es necesario utilizar 
el espacio de estrategias S, o sea, la cavoltura convexa S*. S| se 
designan por Lı las pérdidas del segundo jugador en el juego S, 
dicho juego se define por la tríada E, S* y L, por cierto, las pérdi- 
das L, deben determinarse por el producto directo E X S*. De esta 


suerte, la expresión 
T,=(E, S, L) (8-45) 


define el juego S. La función de pérdidas L1(E, S) se determina 
con esto fundándose en (8-41) de la manera siguiente: 


Li, 5) =P 88% =8S, (8-46) 


donde por ES se designa el producto escalar de los vectores E = 
= (80, ..., EM) y S =(S0,..., S). 


b) Precios inferior y superior del juego en el juego S 


Si el primer jugador emplea en el juego S la estrategia mixta 
$ <E, la magnitud de su ganancia sea igual a: 


Ar (8)= mín LE, S)= mín ES. (8-47) 


Designemos por = (š{", ..., Ef) la estrategia del primer 
jugador con la que Ar, (E) alcanza el máximo. El valor de Ar,(£) 
será igual al precio inferior del juego ap, el cual debido a la 
equivalencia del juego S con el ordinario coincide con «y. Por lo 
tanto, 

Ap = Ar, (5) = máx Ap, (Œ) = máx mín $S. (8-48) 


La estrategia Eo que satisface la correlación (8-48) se denomina 
estrategia minimax del primer jugador. 

Supongamos ahora que el segundo jugador emplea cierta estra- 
tegia S E S*. La magnitud de la pérdida, a la cual él se limita 
con esto, será igual a: 


Br, (S)= me Li (E, S)= máx ES. (8-49) 


Designemos por Se= (S$, ..., Sy”) un punto tal de la envol- 
tura convexa S*, que minimiza la. magnitud Br,(S) El valor 
Br,(So) va a ser igual al precio superior del juego Pp, el que 
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debido a la equivalencia del juego S con el ordinario coincide con 
Br. Así pues, 


r= Br, (So) = min Br, (S) = minmáx gS. (8-50) 


La estrategia So que satisface la correlación (8-50) se deno- 
mina estrategia minimax del segundo jugador. 

Las expresiones para Bp, (S) y Bp puede presentarse en forma 
más cómoda si utilizamos el teorema siguiente. 

Teorema 8-4. Si S es un punto arbitrario del espacio m-dimen- 


sional y E=(£0, ..., E), la variable multidimensional que sa- 
tisface la condición (8-16), se cumple la correlación 
máxES=máx(SU, ..., sm), (8-51) 
Demostración. Sea" SW = máx (SW, ..., Sm). Examinemos 
el valor particular E, correspondiente al caso 
l para i=k; 
ü= . 
o { O para i#k. (8-52) 


En este caso ES = SW, De esta suerte, SW es el valor particu- 
lar del producto escalar ES y, por consiguiente, el subconjunto del 
conjunto de valores ES que'se obtienen con todos los valores po- 
sibles de E. Basándonos en el teorema de límite superior del sub- 
conjunto, hallamos: 


S™ e= máx (SH, ..., SM) K máx ES. (8-53) 
Por otra parte, sustituyendo en ta expresión para ES las magni- 
tudes SW, ..., S' por su valor máximo S™, obtenemos 
ES=HH EMS KSE Oas, (8-54) 
T 7 


Esta expresión es válida con cualquier 2, que satisfaga la co- 
rrelación (8-16), inclusive con dicha E cuando ES se convierte en 
miximo; Comparando (8-53) y (8-54) llegamos a la correlación 
(8-51). 

Utilizando el teorema demostrado, representemos la expresión 
para Br,(S) en la forma 


Br, (5) máx S= máx (S™, ..., Sm), (8-55) 
Deduzcamos varios corolarios de la expresión (8-55). 
Corolario 1. De la condición Br <Br, (S) obtenemos: 
Br < máx (SW, ..,, SM), (8-56) 


Cualquier punto S e S* tiene, por lo menos, una coordenada no 
menor de fir. (o sea, mayor o igual). 
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Corolario 2. Suponiendo que S= S= (S$, ..., SÍ”), obtene- 
mos: 
Br= Bp, (S,) =máx (Sp, ..., Sp»). (8-57) 


El precio superior del juego fr es igual al máximo de las 
coordenadas del punto Sy que determina la estrategia minimax 
del segundo jugador. 


c) Teorema de minimax 


La posibilidad de que cada jugador encuentre su mejor estrate- 
ia se funda en el siguiente teorema, que puede considerarse como 
demostración de la existencia de solución para los juegos finitos. 

Teorema 8-5. Cualquier juego finito tiene precio y cada jugador 
tiene por lo menos una estrategia óptima. 

Premisas de partida, Sean G = (X, Y, L) un juego finito 
y T = (E, H, L), el promedio de este juego. Durante la demostra- 
ción del teorema será cómodo razonar en términos del juego S. 
Por eso, designaremos por T, = (E, S*, Lı) el juego S equivalente, 

Los precios inferior y superior del juego van a ser respectiva- 
mente iguales a ay y Pp independientemente de si examinamos el 
juego T o el juego Iı equivalente al juego S, siendo ap Sp como 
se mostró anteriormente. 

Hara demostrar el teorema es suficiente mostrar que Pr Sap 
p que de la comparación con la desigualdad anterior se va a in- 
erir que @p=fp es decir, que el juego tiene precio, Para de- 
mostrar esta desigualdad es suficiente hallar tal estrategia mixta 
Eo del primer jugador, con la que para todas 
las S € S* tiene lugar: 


Pp <ES, SES” (8-58) 
En efecto, si tiene lugar (8-58), entonces 
Pp < ming S= Ar (8) =ar (8-59) 


De este modo, la demostración del teo- 
rema se reducirá a demostrar la desigualdad 


(8-58). Fig. 8-3. Dominio T 
Demostración. Examinemos el conjunto T en el espacio bidimen 
que consta de todos los puntos ¿=(4M, ... slonal 


+ +=, E), tales que 4 < fr con i = 0, 1 
A m. En la figura 8-3 se muestra el dominio 7 para el espacio 
bidimensional que tiene en el caso dado el aspecto de cuña rectan- 
gular con vértice situado en la recta trazada desde el origen de 
coordenadas a un ángulo de 45° con el eje de las abscisas. Áclare- 
mos algunas propiedades del conjunto 7. 
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El conjunto T es convexo. Examinemos dos puntos arbitrarios 
tı y to de este conjunto. La ecuación del segmento que une estos 
dos puntos va a tener la forma: 


iS +05 w, 0>0 a +ua=l. (8-60) 


Proyectando esta ecuación en el eje i y tomando en cuenta el 
teorema 8-4, obtenemos: 


10 =wb + wtf < máx (4%, 49) < Br (8-61) 


Por consiguiente, cualquier punto del segmento considerado 
pertenece a T y el conjunto T es convexo. 

El conjunto T no se interseca con el conjunto S*, Esto se des- 
prende de que cualquier punto del conjunto S* tiene, por lo menos, 
una coordenada mayor o igual a fr (véase el corolario 1 del teo- 
rema 8-4) lo que significa que 7 y S* no tienen puntos comunes. 

Por cuanto 7 y S* son dominios convexos no intersecados, 
existe un hiperplano que los divide de tal suerte que los conjuntos 

t 


T y S* resultarán situados en tos diferentes semiespacios determi- 
nados por este hiperplano. Por lo tanto, existen cierta a = (0, ... 
+++, 46%) y un número c tales que la ecuación 

ax=c (8-62) 


será la ecuación del hiperplano divisor, siendo 


aS>c para pd: 
at<c para teT. 


Demostremos que a® z> 0, i= 1, ..., m. Sea ò= (6, ... 
«»., 97”), un punto en el que la coordenada i es igual a 1, y 
restantes son Iguales a la pequeña magnitud e > 0. Examinemos 
el punto Sy Œ $”. Por cuanto su coordenada máxima es igual a Br 
(véase el corolario 2 del teorema 8-4), el punto So — $; Œ= T. Por 
consiguiente, 


(8-63) 


aSo > c a (So — 8). (8-64) 
De aquí se deduce que 
aa BP + a m> O. (8-68) 


Si e>0, entonces 8/>0 con k i y ôf =1. Con esto, la 
última condición da: 


an0, i= (8-66) 
Introduzcamos la designación 
== (8-67) 
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Evidentemente, Eo € E, ya que 
at 
=> Lp=L (8-68) 
7 


Introduzcamos, además, la designación 
z (8-69) 


a+ 


Dividamos las desigualdades (8-63) por z al, Tomando en 
cuenta (8-67) y (8-68), obtenemos: 
ES>v para SES; 
Et <v para teT. } 
Examinemos el punto fo con las coordenadas {H= f, —e, 


(8-70) 


e >0, i = 1, ..., m. Evidentemente fo Œ 7. Basándonos en la se- 
gunda de las designaciones (8-70), obtenemos: 
Eolo <v. (8-71) 
Supongamos que e 0, de modo que (fp. Entonces 
Eto X EPR Pp D P= Br: (8-72) 
Comparando (8-71) y (8-72), hallamos que 
">> (8-73) 
Con esto, la primera de las desigualdades (8-70) da: 
ES SyS r (8-74) 


lo que demuestra la desigualdad (8-58). 
De esta manera v = a. = fp ès el precio del juego, consti- 


tuyendo Eo y So las estrategias mixtas óptimas de los jugadores. 


d) Representación geométrica del principio de minimax 


Mostremos que el punto So que determina la estrategia de ml- 
mimax del segundo jugador, es un punto límite del dominio S* 


tal, en que el dominio T es tangente al S*. 

Como vimos, So=(Sp", ..., SI") ES”, con esto mäxX 
X (SI, ..., SE) =Bp- Por otro lado, £=(10, ..., (M7, si 
0<Bri=l... M. 

Examinemos el punto Si=(S'—e,..., SI" —e), donde 
e>0. Evidentemente, máx(S[P—e, ..., SIW—e)<Pp, así que 


SP — e< ps i=l, ..., m. Luego, S4 E T. Pero el lim S¿=S, E S’. 
e> 
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De aquí se derivan dos deducciones: 

1) So es un punto límite del dominio S*; 

2) So es un punto en el cual el dominio T es tangente al do- 
minio S*. 

Estas propiedades permiten hallar geométricamente con facili- 
dad la estrategia de minimax So para el caso cuando el primer 
jugador tiene dos estrategias puras, es decir, cuando el juego S 
surgalents se representa «mediante el conjunto de puntos del 
plano. Para construir el dominio 7, tangente al dominio S*, es 


Ll y) 1(Zo. Y) LY) 


A (Zag) EPT ZA 


Puntos 
de minimax 


Fig. 8-4. Determinación geométrica de la estrategia de minimax 


cómodo trazar una recta auxiliar del origen de coordenadas, a un 
ángulo de 45°, al eje de las abscisas en el cual se encuentra el 
vértice de la cuña rectangular que forma el dominio T. 

En la figura 8-4 se muestran los diferentes casos de situación 
mutua de los dominios S* y T y están marcados los puntos que de- 
terminan la estrategia de minimax Sọ del segundo jugador. 


8-4. RESOLUCION DE LOS JUEGOS 


` a) Estrategias predominantes y útiles 


Como sabemos, las estrategias mixtas de los jugadores cons- 
truyen una mezcla de estrategias puras x= X e y =Y, que se to- 
man en correspondencia con ta distribución de las probabilidades 
E(x) y n(y). No obstante, en muchos casos el empleo de algunas 
de las estrategias puras es manifiestamente irracional y al deter= 
minar la estrategia mixta óptima las mismas simplemente no de- 
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ben tomarse en consideración. Vamos a denominar estrategias 
útiles del jugador aquelias de las estrategias puras que forman 
parte de la estrategia mixta óptima. Para distinguir con mayor 
facilidad las estrategias útiles, introduzcamos el concepto de estra- 
tegias predominantes. 

Examinemos dos estrategias y, e yp del segundo jugador. Su- 
pongamos que el primero emplea la estrategia x;. Las pérdidas del 
segundo serán, respectivamente, q Y Qip. Puede sellar que con 


cualquier į 
qu <qip i=l (8-75) 


es decir, en la matriz de juego las pérdidas en la columna / no su- 
peran las pérdidas correspondientes en la columna p. Esto signifi- 
ca, que al segundo jugador bajo ningunas condiciones le es ven- 


Fig. 8-5. Determinación del predominio en el juego $ 


tajoso emplear la estrategia yp, ya que empleándola, incurre a sa- 
biendas en pérdidas mayores que con la estrategia yı Por eso la 
estrategia yp deberá ser omitida, es decir, borrada de la matriz. de 
juego. La estrategia y; que satisface la condición (8-75) se deno- 
mina predominante con respecto a la estrategia yp. 
Las estrategias predominantes del segundo jugador tienen clara 
representación geométrica al pasar al juego S equivalente en el 
lano. En este caso m = 2 y la condición (8-75) se escribirá en 


a forma 
qu Ma LI (8-76) 


En la figura 8-5 se muestran dos casos de disposición de los 
puntos C; y Cp correspondientes a las estrategias puras y: e yp del 
segundo Jugados. Es fácil ver que en el caso representado en la 
figura 8-5, a la estrategia C: predomina sobre la Cp, y en el repre- 
sentado en la figura 8-5, b ninguna de las estrategias es predomi- 
nante. Para que la estrategia y: predomine sobre la yp, el punto C; 
debe encontrarse más a la izquierda y más abajo del punto Cp. 

De manera análoga se determinan las estrategias predominantes 
del primer jugador. Decimos que la estrategia x; predomina sobre 
la Xp si la ganancia del primer jugador con la estrategia x: es 
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mayor que las ganancias con la estrategia xp con cualquier estra- 
tegia y = Y: 
(uqa i=l, ...;, n, (8-77) 


es decir, si en la matriz de juego las pérdidas en la fila xı son 
mayores que las pérdidas correspondientes de la fila Xp. 


Ejemplo 8-3. En la figura 8-6 cl juego S se presenta en el plano con los 
puntos Cı— Cs. Como se ve en la figura, C, predomina sobre el punto Cs 
y Cı, Ca y Ce predominan sobre el Cs. Eliminando los puntos Cs y Ca llegamos 
al juego S determinado por los puntos Cs, Ca, Ca, Cs entre los cuales no hay 
predominantes. 


La eliminación de la matriz de juego, de aquellas estrategias 
sobre las cuales predominan otras, simplifica considerablemente 


el juego y, por consiguiente, también la 
eias búsqueda de la estrategia óptima, Su- 
GF æ pongamos ahora que en el juego consi- 


derado AN ri estrategia predomina 
sobre otra. Cabe preguntar si son útiles 
todas las estrategias en este caso, es 
decir, si se utilizan para obtener la es- 
trategia mixta óptima, 
Fig. 8-6. Ejemplo de juego S Sirvámonos del juego presentado en lafi- 
gura 8-6. Después de eliminar los puntos Cs y Cs 
sobre los cuales predominan otros puntos, llegamos al juego representado por 
los puntos Cy, Ca, Ca y Co Una vez construido el dominio T, vemos que el pun- 
do So, que determina la estrategia óptima del segundo jugador se encuentra en 
la recta que une los puntos Ci y Cz y puede representarse como la media ponde- 
rada de dichos puntos. De este modo, la estrategia mixta óptima del segundo 
jugador constituye la mezcla de las estrategias puras y, e ya que son útiles 


en el caso dado. Las estrategias ys e ya no son útiles y no es racional emple- 
arlas. 


El número total de estrategias útiles de cada uno de los juga- 
dores puede determinarse partiendo de que la envoltura convexa S* 
del conjunto finito {C}, ..., Cn} es un poliedro convexo en el es- 
pacio m-dimensional. El punto Sə, que es un punto límite del po- 
liedro convexo S*, va a pertenecer sin falta a una de sus caras 
cuyos vértices corresponderán a las estrategias últiles del segundo 
jugador. Tomando en consideración que el número de vártices de 
cualquier cara del poliedro convexo $* no puede exceder del nú- 
mero total de sus vértices, o sea el número n, y no puede exceder 
de la dimensionalidad del espacio en el cual existe el poliedro con- 
vexo, o sea, del número m, llegamos a la conclusión de que el nú- 
mero de estrategias del segundo jugador no sobrepasa del menor 
de los números m y n. Por cuanto las nociones del primero y del 
segundo jugadores son convencionales, también es cierta la dc- 
ducción análoga para el primer jugador. 

De esta suerte, en el juego con matriz de tamaño mX n el 
número de estrategias útiles de cada uno de los jugadores no 
sobrepasa del menor de los números m y n. 
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Teorema 8-6. Si uno de los jugadores se atiene a su estrategia 
mixta óptima, la ganancia de los jugadores se mantiene invariable 
e igual al precio del juego v, independientemente de cuál estrate- 
gia mixta (o pura) emplea el otro jugador, si éste no sale de los 
límites de sus estrategias útiles. 

Demostración, Sea v el precio del juego y ë= ($0, -.., 89m) 
la estrategia mixta óptima del primer jugador. Si el primer juga- 
dor qpe su estrategia óptima Eo, su ganancia no puede ser me- 
nor de v. 

Supongamos que el segundo jugador tiene k estrategias útiles 
que se designan por yı, -.., Ya. Si el primer jugador emplea su 
estrategia óptima ¿o y el segundo utiliza la estrategia útil 
gli ..., Å), la ganancia del primer jugador v; no será menor 

le v: 


Ma iml, a k (8-78) 


Examinemos ahora la estrategia mixta óptima del segundo 
jugador no.. Esta se presenta por medio de las probabilidades n 
con las que se emplean las estrategias puras útiles. Lo esencial 
es que no puede ser 1/?=0 con i = l,..., k, ya que en este caso, 
la i-éstima estrategia no formaría parte de la estrategia mixta 
óptima del segundo jugador, es decir, no sería útil. 

Hallemos la ganancia media del primer jugador si el segundo 
emplea su estralegia mixta óptima. El empleo de la estrategia 
mixta óptima m por el segundo jugador, significa que el primer 
jugador va a obtener las ganancias vı, ..., va correspondientes 
a las estrategias puras yi, ..., Ya Con las probabilidades mf", ... 

+», ni, Entonces, la ganancia media del primer jugador va a ser 
igual a: 


a 
Langa =D o HoP = vn. (8-79) 


Sustituyendo v; por v y teniendo en cuenta (8-78), obtenemos: 


5 
Lea <Y 2, =v. (8-80) 


Pero la ganancia media con las estrategias óptimas de los 
jugadores es el precio del juego v, es decir: 
Lea =". (8-81) 


Por otro lado, la correlación (8-79) puede pasar a ser (8-81) 
únicamente, si se cumple la condición 


w=», eE > (8-82) 
lo que demuestra el teorema, 
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De este modo, la ganancia media del primer jugador, si éste 
emplea su estrategia óptima mixta, será la misma en el caso de 
que el segundo jugador emplee cualquiera de las estrategias útiles, 
es decir, cualquier estrategia mixta que conste de estrategias úti- 
les. 

Claro está que debe recordarse que siempre lo más ventajoso 
es utilizar la estrategia mixta óptima. El empleo de las estrategias 
útiles aunque no óptimas no acarrea daños sólo en el caso de que 
el contrincante se atenga a la estrategia óptima. La utilización 
de la estrategia óptima siempre asegura una ganancia igual al 
precio del juego. 

Ahora queda por esclarecer, cómo se hallan las estrategias 
útiles y óptimas de los jugadores, es decir, estudiar la cuestión de 
la búsqueda de la resolución del juego. 


b) Búsqueda de las estrategias óptimas 


Examinemos el juego G=(X, Y, L) con la matriz m X n. 
Vamos a considerar que en el juego G falta el punto silla (en 
caso contrario la solución se halla fácilmente por la regla estable- 
ctida en el $ 8-2) y se han eliminado las estrategias sobre las 
cuales existe predominio. 

Designemos por E= (EP, sees Em) la estrategia mixta óp- 
tima del primer jugador. Algunas Ej% pueden ser iguales a cero, 
Esto significa que la estrategia correspondiente x; no es útil. Ante 
nosotros se plantea el problema de hallar los valores de E para 
i=l... m. 

Supongamos que el segundo jugador empleará la estrategia yn. 
Si dicha estrategia es útil, la ganancia del primer jugador va a 
ser igual a v, pero si Ja estrategia no es útil, la ganancia del pri- 
mer jugador puede ser hasta mayor de v. Luego, en el caso general 
se cumple que 


L èo Y) EG E + FEO >» (8-83) 


Tales expresiones pueden formarse para cada estrategia pura 
del segundo jugador, es decir, para i = l,..., n. Además, se sabe 


que 
aSo PH PER (8-84) 


Vamos a considerar que v > 0. Esto va a ocurrir siempre, si 
todos los elementos de la matriz de juego qin son positivos. Si 
entre los elementos q; hay los negativos, éstos pueden hacerse po- 
sitivos adicionando a todos los elementos de la matriz de juego 
cierto número v > 0. Entonces el precio del juego también au- 
menta en la magnitud y”, 
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Dividamos las ecuaciones (8-83) y (8.84) por v, designando 
D 
Ž =p. (8-85) 


Es cvidente que p;>0. Las desigualdades (8-83) con k= 
= Í, ..., n se escribirán entonces en la forma: 


PUE ++ + Panam > l; 


8-86) 

Plint >>> H Pagan > Ly Ga 
y la correlación (8-84) tomará la forma: 

Mt- tont. (8-87) 

Forman parte de las desigualdades lineales (8-86) Jas magni- 

tudes incógnitas pı, ..., p” que determinan la estrategia mixta 


del primer jugador. La determinación de la estrategia mixta óp- 
tima requiere la búsqueda de una solución del sistema (8-86) tal 
que la magnitud v se vuelve máxima y, por consiguiente, la forma 
lineal (8-87) adquiere el valor mínimo. Pero esto es un problema 
corriente de programación lineal. 

Para más comodidad se debe pasar en las expresiones (8-86) de 
desigualdades a igualdades, substrayendo de los segundos miem- 
bros las incógnitas positivas adicionales z; lo que da el sistema 
de las ecuaciones 


Put + Pram n=l, i=1l,..., n (8-88) 


juego v y las estrategias útiles del segundo jugador yi, ..., Yr 
ara buscar la estrategia mixta óptima del segundo jugador 
m=, --.. n), que contiene Æ incógnitas ný’, ..., NP, es 
necesario formar k ecuaciones. Una de ellas es 

MA t= (8-89) 


Obtenemos las k— 1 ecuaciones restantes formulando expre- 
siones para las pérdidas medias con la estrategia mixta óptima 
del segundo jugador y para k— 1 estrategias útiles cualesquiera 
del primer jugador. Así, para la estrategia útil x, vamos a tener 


la ecuación 
Waat n=. (8-90) 


Al componer £— 1 ecuaciones de la forma (8-90) y al adicio- 
narles la ecuación (8-89), obtendremos Æ ecuaciones resolviendo 
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las cuales es fácil hallar las magnitudes >, np, que deter- 
minan la estrategia mixta óptima o del segundo jugador. 


Ejemplo 8-4. Hallar la solución del juego con la matriz presentada en la 
tabla 8-6, 


Tabla 8-6 Tabla 8-7 
n n n m n n 
x 2 == 4 5 7 2 9 
tA —3 4 = x: 2 9 0 
xs 1. 5 6 x 9 0 u 


Ante todo cerciorémonos de que en el juego falta el punto silla y ninguna 
de las estrategias predomina sobre las otras, Para no tener que operar con ele- 
mentos negativos de la matriz del juego sumamos a cada elemento de la 
matriz el número 5. La matriz del juego adquiere el aspecto do la tabla 8-7, 

Las ecuaciones (8-88) se escriben en la forma 


Tpi + 2p: + 9ps — z; == l; 
2p, +99 = z= l; 
9p: + lip 2 =1. 


La solución de estas ecuaciones debe satisfacer la condición de minimo de 
la forma lineal (8-87) 


Pi + p: + ps = min. 


Resolviendo el problema de programación lineal obtenido, hallamos: 
z123 z = 0; p= 0,05; p=0,1; py=0,05, 


Como vemos, todas las tres estrategias yı, ya e ys son útiles. De la expro- 
sión (8-87) encontramos: 7 


PFF 


y 


5. 
Con esto 


EP =85p,=025 EN = 5p, = 0,5; EP = 5p, = 0,25. 


Para la búsqueda de Ja estrategia mixta óptima del segundo jugador forma- 
mos una ecuación del tipo (8-89) 


PHP H= 
y dos ecuaciones del tipo (8-90) para las estrategias útiles del primer jugador 
poa me mP =5; 
MP f? =5. } 
Resolviendo conjuntamente las tres ecuaciones obtenidas, encontramos: 
ni =a 0,25: nP =05. 


Recordando que se adicionó el número 5 a todos los elementos de la matriz, 
hallamos el precio del juego v— 5 = 0. 
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€) Representación geométrica del principio de minimax 
en el juego de 2 X n 


En el juego de 2X n la estrategia mixta del primer jugador 
representa el par ordenado ¿= (£, 1 — t). Si el segundo jugador 
emplea la estrategia Ya, la ganancia media del primero es 


L (È, ya) = bgr + (1 — E) que = qar + 5 (914 — dan), (8-91) 


o sea, depende linealmente de la magnitud £ como se muestra en 
la fig. 8-7. 

La determinación de la estrategia óptime Eo se examinará en el 
ejemplo del juego con la matriz presentada en la tabla 8-8. En la 
figura 8-8 están designadas con, las ci- 
fras 1, 2 las líneas de ganancia para las Tabla 8-8 
estrategias yi, Ya € ys, respectivamente. ——m 
La ganancia garantizada del primer 


jugador con cualquier £ va a deter- ni E 
minarse por el límite inferior de la 
granoa dada, marcada con línea gruesa. x 1 3 5 
egún el ginei de minimax, la X 4 2 1 
estrategia óptima ġo será aquella con 


la que es máxima la ganancia ga- 

rantizada. Dicha estrategia se define por el punto M determinado 
por la intersección de las líneas de ganancias con las estrategias 
H en que serán de este modo estrategias útiles del segundo 
jugador. 


AlE, Ya) 
Iik 
Jon 
€ 
Fig. 8-7. Líneas de ganancia Fig. 8-8. Estrategia de mini- 
con la ostrategia Ya max en el juego 2 X m 


La estrategia mixta óptima Eo puede hallarse por las condicio- 
nes de igualdad de la ganancia media del primer jugador con las 
estrategias útiles yı e ya del segundo: 

to + 4(1 — t) =3% +2 (1 — toh, 
lo que da Lo = !/2. De este modo, Eo = (la, '/2). El precio del juego 
se halla ahora como la ganancia media del primer jugador con la 
estrategia Eo y cualquiera de las estrategias útiles, por ejemplo, ys 
del segundo: 
wv=t +4(1—2)=25. 
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La estrategia mixta óptima del segundo jugador m, = (nh 
1— mf), 0) con el precio conocido v del juego se encuentra por la 
expresión de las pérdidas medias del segundo jugador con cual- 
quiera de las estrategias útiles del primero. Por elemplo, con la 
estrategia x, obtenemos: 


aP +3(1—01P)=25, 
lo que da nP ="/,. Así pues, n= ("ip Y, 0). 


PROBLEMAS PARA EL CAPITULO 8 


8-1. Calcule la matriz de pérdidas para el juego dado en el ejemplo 8-1. 

8-2, Calcule la matriz de pérdidas para el juego siguiente dibujando pre: 
viamente el árbol del juego. 

Se lanza una moneda simétrica y sí cae en escudo, el primer jugador elige 
uno de los números 1, 6, Si cae en estrella éste elige uno de los números 2, 7 
Después, el segundo jugador elige uno de los dos números 3, 9. Los números 
elegidos por los jugadores se adicionan y dan la suma S. Después se hace el 
sorteo con una probabilidad de 0.8 de calda en escudo. Si en este caso la mo- 
neda ene en escudo, el segundo jugador paga al primero S rublos, si cae en 
estrella, el primer jugador paga al segundo $ rublos. El primer jugador conoce 
el resultado de la primera jugada aleatoria. El segundo no sabe nada acerca de 
las jugadas anteriores. 

83. Un cómodo necanismo de elección aleatoria es la posición del segun- 
dero en un cuadrante de reloj en un momento aleatorio de tiempo. Describa el 
empleo de este mecanismo de elección aleatoria para obtener las distribuciones 
de probabilidades siguientes: 


3 2 dde de 122 
(> 3) (© y 5) (C 5 5) 
8-4, Decpriba las acciones de los jugadores en una partida del juego cuya 
T á 


matriz está presentada en la tabla 8-4, en caso de utilizar el primer jugador la 
estrategia pura xə, y el segundo, la estrategia mixta y = (0,5; 0,5). 


Capítulo noveno 


TEORIA DE LAS DECISIONES 
ESTADISTICAS 
(JUEGOS ESTADISTICOS) 


9-1. ESTRUCTURA DE LOS JUEGOS ESTADISTICOS 


a) Juegos estratégicos y estadísticos 


Los llamados juegos estadísticos son un tipo específico de 
juegos que tienen gran importancia al analizar distintas situa- 
ciones prácticas. Ellos tienen una serie de diferencias substanciales 
con aquel tipo de juegos que se estudiaron hasta ahora y que pue- 
den ser llamados juegos estralégicos. 

La base de la teoría de los juegos estratégicos es la suposición 
de que los intereses de los dos jugadores son opuestos. Cada uno 
de los jugadores trata de elegir su estrategia de tal suerte que 
obteoga la mayor ventaja para sí y reduzca al mínimo la ventaja 
del adversario. En tales juegos cada jugador obra activamente y 
trata de utilizar en lo posible su estrategia óptima. 

Sin embargo, en muchas situaciones de la práctica nos en- 
contramos con casos en que uno de los jugadores resulta neutral, 
es decir, no trata de sacar para sí la ventaja máxima y, por tanto, 
no tiende a revertir en su beneficio los errores cometidos por el 
contrario. Se catalogan entre dichos juegos aquellos en los que 
la naturaleza Obra en calidad de uno de los jugadores. Aquí en- 
tendemos por el término “la naturaleza”, el total de circunstancias 
exteriores en cuyas condiciones es necesario tomar la decisión. 

La naturaleza no puede considerarse como un contrario racio- 
nal que pudiera utilizar los errores cometidos por el hombre. En 
otras palabras, la naturaleza no tiene mala intención con respecto 
al hombre. Ella+simpiemente se desarrolla y obra en corresponden- 
cia con sus leyes y está en manos del hombre revertir estas leyes 
en su beneficio. Si el hombre conociera con perfecta exactitud las 
leyes de la naturaleza, pudiera utilizarlas con beneficio máximo 
para si. Pero en muchos casos el hombre no conoce la ley de la 
naturaleza o no la conoce suficientemente bien. 

El pago ineludible por el intento de obtener una decisión en 
condiciones de información incompleta sobre la ley de la natura- 
leza es la posibilidad de tomar decisiones erróneas. Con esto, en 
la práctica las situaciones pueden ser tales que hacen imposible 
renunciar por completo a tomar alguna decisión. Además, la deci- 
sión de renunciar a tomar una decisión es también una decisión 
y puede tener consecuencias tan indeseables como otras decisiones. 
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La única salida de la situación creada es la elaboración por el 
hombre de tal estrategia respecto a la toma de decisión, que aun- 
que no excluya la posibilidad de tomar decisiones incorrectas, sin 
embarga, reduzca al minimo las consecuencias indeseables moti- 
vadas. 

Es cierto que el hombre tiene además la posibilidad de estudiar 
a su adversario, es decir, a la naturaleza, mediante la realización 
de un experimento. 

Teóricamente, realizando un experimento infinito, podemos ha- 
cer tan completos como querramos nuestros conocimientos de la 
naturaleza obrando ya en condicioens de completa determinación. 
No obstante, dos circunstancias lo dificulta: 

para efectuar el experimento se necesita tiempo mientras que en 
muchos casos hay que tomar la decisión rápidamente; 

el experimento requiere gastos materiales, es decir, puede ser 
costoso, más costoso que la ganancia que proporcionarán los co- 
nocimientos adicionales oblenidos en el experimento. 

Por eso un importante problema del hombre en su juego contra 
“la naturaleza” es tomar la decisión de si hace falta realizar el 
experimento, y si hace falta, cuál, cuándo se terminará y qué ope- 
raciones se realizarán después de terminado el mismo. 

Los juegos en los cuales un adversario es la naturaleza y el 
otro, el hombre, recibieron la denominación de juegos estadísticos, 
y la teoría de dichos juegos se denomina teoría de las decisiones 
estadisticas. En lo sucesivo vamos a llamar estadista al hombre 
que toma parte en el juego contra la naturaleza. 


b) Espacio de estrategias de la naturaleza 


Vamos a entender por estrategia de la naturaleza el total de 
condiciones exteriores en las cuales resulta necesario tomar una 
decisión. Llamaremos estado de la naturaleza 0 a este total de 
condiciones exteriores. En el caso genera! existe cierto conjunto 
de estados posibles de la naturaleza O = (0, ..., Om} que, como 
acordamos en el capítulo 6, vamos a llamar espacio de estados de 
la naturaleza. Vamos a denominar a los elementos 0; de este es- 
pacio estrategias puras de la naturaleza. 

Si supiéramos por anticipado cuál de sus estrategias puras 
emplea la naturaleza en cada caso concreto, utilizaríamos con se- 
guridad la decisión basada en el conocimiento completo del estado 
de la naturaleza. Sin embargo, por lo común sólo se conoce la 

ta de estrategias puras de la naturaleza. Además, de la experien- 
cia del pasado se conoce cuán frecuentemente la naturaleza emplea 
una u otra de sus estrategias puras, es decir, se conoce la distri- 
bución apriorística de probabilidades 3(0) en el espacio de esla- 
dos de la naturaleza O. Vamos a denominar estrategia mixta de 
la naturaleza esta distribución apriorística de las probabilidades 
E(0). 
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c) Espacio de estrategias del estadista 
y función de pérdidas 


La tarea del estadista consiste en tomar alguna decisión o rea- 
lizar alguna operación del total de decisiones u operaciones. De- 


signemos por aj, ..., e, las operaciones posibles del estadista. 
Cada una de ellas es una estrategia pura del estadista, El con- 
junto A = (a,, .... aj) es el espacio de estrategias puras del esta- 
dista. 


El estadista debe saber estimar cada una de sus operaciones, 
Para ello éste admite que llevando a cabo la operación a, puede 
sufrir una pérdida L(0, a), que depende tanto de la operación 
ejecutada a como del estado desconocido de la naturaleza 0. La 
función L(8, a) denominada función de pérdidas, debe estar de- 
terminada anticipadamente para todas las combinaciones posibles 
de a = A y 0S0, es decir, debe cstar presentada con el producto 
directo de los conjuntos O X A. Ella puede presentarse analitica- 
mente, o por analogía con (8-7), mediante una matriz de pérdidas 


de la forma 
qu... Qu 
raro Ne (9-1) 


Am +- Gmi 


Q=lqu l= 


donde qu = L(0,, ay). El conocimiento de la función de pérdidas 

ermite al estadista efectuar las operaciones que son mejores en 
as condiciones de información sobre el estado de la naturaleza de 
que dispone, 

Por lo común el estadista conoce la estrategia mixta de la natu- 
raleza, o sea, la distribución apriorística de las probabilidades 
E(0) en el espacio de estados de la naturaleza O. El conocimiento 
de la distribución apriorística de las probabilidades permite deter- 
minar las pérdidas medias que sufre el estadista realizando una 
u otra operación: 


L(E, a) = M [L (0, a)]== 2 L(0, a) $ (8). (9-2) 


La mejor operación para el estadista será la llamada operación 
de Bayes a*, con la cual las pérdidas serán mínimas e iguales a: 


RE) = L ($, a) =i LẸ, a). (9-3) 


El estadista no debe limitarse forzosamente a utilizar sólo una 
estrategia pura. El puede utilizar una mezcla de estrategias puras 
en correspondencia con cierta ley probabilística de distribución. 
En este caso vamos a referirnos a la estrategia mixta del esta: 
dista, Para emplear la estrategia mixta el estadista debe presentar 


la distribución de las probabilidades n(a)=(n'", ..., n™), que 
determina las probabilidades con Jas cuales va a utilizar sus estra- 
tegias puras au ..., &m En el caso general dispone de cierta co- 
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lección de estrategias mixtas H = {mı (a), -... nela)) denominada 
espacio de estrategias mixtas del estadista 

Si el estadista emplea la estrategia mixta y (a) y la naturaleza 
emplea la estrategia mixta £(0), entonces las pérdidas medias 
del primero son 


LE M= Mo. alli, )]= E LIO, a) nlo. (9-4) 


En este caso la tarea del estadista consiste en elegir una estra- 
tegia y*(a)e H tal que con clla sus pérdidas medias L($, n*) 
sean minimas, es decir, 


L, n 


mín L (£, n). 19-5) 
nen 


En los casos examinados se resolvió un problema estadistico 
relativamente sencitlo, la determinación de la mejor estrategia del 
estadista basándose solamente en la información apriorística sobre 
el estado de la naturaleza. Aqui, el estadista no hace intentos de 
precisar sus conocimientos sobre el estado de la naturaleza efec- 
tuando un experimento. Por eso, el tipo dado de juego estadistico 
puede ser [lamado juego estadistico sin experimento. 


d) Ejemplos de juegos estadísticos 


Para una emejor comprensión de la estructura de los juegos 
estadísticos y de los mélodos de su resolución, pondremos varios 
ejemplos con los cuales más adelante vamos a ilustrar los postu- 
lados fundamentales de la teoría de las resoluciones estadísticas. 


Ejemplo 9-1. Problema de sustitución del equipo. El equipo complejo y caro, 
instalado en una empresa, después de % años de trabajo puede encontrarse cn 
uno de los tres estados: 

01, el equipo está en perfecta capacidad de funcionamicnto y sólo requiere 
una pequeña reparación corriente; 

Va, algunas piezas se han desgastado consi 
reparación seria o su cambio; 


rablemente y requieren una 


Tabla 9-1 


Probabilidades apriorísticas de los estados 
de la naturaleza y pérdidas en el problema 
de sustitución del equipo 


A 
o to 

o as 
o 02 1 3 5 
h 05 5 2 4 
d 0,3 7 6 3 
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Os, las piezas principales se han desgastado tanto que es imposible la 
explotación ulterior del equipo. 

La experiencia del pasado, al explotar un equipo análogo, muestra que en 
el 20% de los casos éste puede encontrarse en el estado ®, en el 50% de las 
ocasiones, en el estado 0, y en el 30% de los casos, en el estado 02 

Para la empresa son posibles tres diferentes modos de proceder 

as, dejar funcionando el equipo un año más. realizando una pequeña repara- 
ción por sus propios medios; 

a, realizar la reparación del equipo llamando a una brigada especializada 
de reparadores, 

as, cambiar el equipo por un nu 

En la tabla 9-1 se dan las pérdic 
modos de proceder. Forman parte de 
reparación o de la sustitución del equipo, asi pérdidas molivadas por 
el empeoramiento de la calidad de la producción y por los paros provocados 
por el equipo defectuoso. En esta misma tabla se dan las probabilidades apriorís- 
ticas de los diversos estados de la naturaleza, cs decir, la estrategia mixta 
de la misma E(0) 

Para la estrategia mixta presentada E(0) las pérdidas medias con los 
distintos modos de proceder son: 


ire la empresa con los distintos 
de las pérdidas el costo de la 


LG 10, a)5(0)=1-024+5-054+7-0,3=48, 


L(5.a)=34  L(Ea)=39 


Ejemplo 9-2, Problema de la linea tecnológica. A la línea tecnológica puede 
Hegar materia prima con pequeña cantidad de impurezas (04) y con gran 
cantidad de impurezas (0). Se sabe que en promedio llega un 60% de materia 
prima de primera clase y un 40% de segunda clase. Para utilizar materias pri- 
mas de distintas clases se han previsto tres regimenes de funcionamiento de la 
linca tecnológica; ai, as y as. En la tabla 9-2 se dan las probabilidades aprioris- 
ticas de los estados de la naturaleza y las pérdidas, que reflejan la calidad de 
la producción elaborada y los gastos de materias primas según la calidad de 
éstas y el régimen de funcionamiento de la línea tecnológica. 


Tabla 9-2 


Probubilidades apriorísticas de los estados 
de la naturaleza y pérdidas en el problema 
de la línea tecnológica 


Las pérdidas medias correspondientes a las probabilidades apriorísticas pre- 
sentadas con diferentes regimenes de funcionamiento son: 


L(G,a)=2 LE, ap=18 L($, a) = 28 


El establecimiento del régimen de funcionamiento az será la operación de 
Bayes, 
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9-2. JUEGOS ESTADISTICOS SIN EXPERIMENTO 


a) Representación del juego estadístico sin experimento 
en forma de juego S 


El juego estadístico puede representarse en forma de juego S 
equivalente al igual que se hizo con los juegos estratégicos. Para 
esto vinculamos con cada una de las estrategias puras a, X 
X (j = 1, ..., 1) el punto Cj = (gi; ..., mj) en el espacio de m 
dimensiones cuyas coordenadas serán las pérdidas del estadista 
L(0, a)= qy con diferentes estados de la naturaleza 
d,(i= l,..., m). Así pues, en el problema de la linea tecnológica, 

Aliet a las estrategias puras del estadista a, az 
gae y as yan a corresponder los puntos del pla- 

se no Cı =(0,5); C¿=(1,3) y Cs =(3,2), 

4 como se muestra en la figura 9-3. La en 
voltura convexa S* de los puntos (Cy, Cu, 
C3} proporciona el dominio de todas tas 
estrategias posibles tanto puras como mix- 
tas del estadista. 

En lo adelante examinaremos varios 
principios por los cuales puedo guiarse el 
estadista al alegir su estrategia. Al ha- 
cerlo, es necesario destacar que entre los 
E problerscrresenteción — estadistas no existe una opinión única en 
Icchhológica en forma de Cuanto a cuál de los principios es el mejor 

juego S en los juegos estadisticos. En otras pa- 
labras, no existe una regla universal que 
permita elegir una determinada forma de acción independiente- 
mente de la situación creada. Sin embargo, aunque pueden haber 
desacuerdos respecto a lo que debe hacerse en una situación dada 
llegamos a un acuerdo total respecto a lo que no ha de hacerse. 
Esto puede realizarse introduciendo el concepto de estrategias ad- 
misibles, análogo al de estrategias predominantes en los juegos 
estratégicos. 


ASNO aa 


O 


b) Estrategias admisibles en los juegos estadísticos 


Supongamos, que examinamos la estralegia mixta del estadista 
nta). Pueden presentarse dos casos: 


i) No puede hallarse ninguna estrategia mejor que n(a). Esto 
significa que no existe una estrategia n’ (a) tal que 


L(0,M<L(0, y (9-6) 


para todas las © = O, aunque para ciertas 0 la relación (9-6) será 
válida. En este caso la estrategia n(a) puede llamarse admisible. 
Pero ella no es necesariamente preferible ya que pueden haber 
otras estrategias que también merecen atención. 
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2) Existe la estrategia n'fa), mejor que n(a). Esto significa 
que para la estrategia n' (a) la relación (9-6) va a cumplirse con 
todas las Y E O. En este caso es necesario dejar de considerar la 
estrategia n (a) en favor de la estrategia y'(a), o sea, considerarla 
inadmisible. 

Es cómodo examinar las estrategias admisibles en términos del 
juego S. Por cuanto en el juego S la estrategia del estadista se 
determina por el punto S de la envoltura convexa S* y las pérdi- 
das con las distintas Y e O se determinan por las coordenadas de 
este punto, la estrategia delerminada por el punto S será admi- 
sible si no existe otro punto S’ e S*, todas las coordenadas del 
cual serán menores que las correspondien- 

Les al punto S- 

Examinemos el método de búsqueda de 
las estrategias admisibles para el caso 
en que el espacio de los estados de la 
naturaleza consta de los dos elementos 
0, y 02 En la figura 9-2 se muestra el 
dominio convexo S* correspondiente a este 
caso: Fig. 9-2. Estrategias ad- 

Analicemos la estrategia determinada misibles en eae S$ 

or el punto S, que constituye un punto in- 

erior del dominio S*. Dicha estrategia no es admisible, ya que 
todos los puntos que se encuentran en el segmento OS, dentro del 
S* determinan estrategias mejores que S,. La mejor de ellas es la 
estrategia S que pertenece al limite inferior izquierdo del domi- 
nio S*. Por eso, todos los puntos interiores pueden eliminarse en 
favor de los puntos pertenecientes al límite inferior izquierdo del 
dominio S* marcado en la figura 9-2 con una linea gruesa, 

No obstante, el desplazamiento del punto a lo largo de este 
límite no da ventajas algunas ya que en este caso disminuyen las 
pérdidas correspondientes a un estado de la naturaleza pero au- 
mentan las pérdidas correspondientes al otro estado de la natu- 
raleza. Por eso los puntos pertenecientes al límite inferior iz- 
quierdo del dominio S* determinan las estrategias admisibles del 
estadista. 

Ejemplo 9-3. En el problema de la línea tecnológica (véase la fig. 9-1) el 
límite inferior izquierdo del dominio S* consta de los segmentos C1Ca y CaCs. 
cada uno de los cuales se determina por la combinación de las estrategias pu- 


raS As, de Y 07, as. Sean 0 < % <1. Entonces, la ecuación para el segmento 
CıC: se escribe en forma vectorial del modo siguiente: 


S=wC,+(1—w)C (9.7) 
Esta ecuación define la estrategia mixta n(a) = (w, i —10,0). Al proyec- 
tar en los ejes de coordenadas la ecuación del segmento C:Ca, obtenemos: 


L(0)=0-0+1(1-w)=1—w } 


L(0n) = 50 + 3U w) = 3 4 20 (%0) 
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Análogamente, la ecuación del segmento CaCa que determina la estrategia 
mixta n(a) = (0,00, 1 — w) se reduce a la [orma 


LO, m=3-20, LW. m=2+w (9-9) 


c) Principio de elección de las estrategias 
en los juegos estadísticos 


Se denomina principio de elección la regla que permite deter- 
minar la mejor estrategia mixta del estadista. En diversos casos 
el estadista puede utilizar diferentes principios de su estrategia. 

El principio de minimax puede ser uno de los posibles princi- 
pios de elección de la estrategia. Este principio se emplea con 
éxito en los juegos estratégicos cuando se juega contra un adver- 
sario inteligente que desea hacernos el daño máximo. No obstante, 
en diferentes casos también es útil emplear este principio en los 
juegos estadísticos. 

Según el principio de minimax el estadista elige una estrategia 
mixta n (a) con la cual las pérdidas medias L(0, m) van a ser mi- 
nimas siendo el estado de la naturaleza 0 el peor para éste, El 
caso peor será aquel 0 E O en que la magnitud L(0, n) adquiere 
el valor máximo, El estadista debe minimizar esta magnitud, o sea, 
elegir la estrategia n*(a) que garantiza el cumplimiento de la 
condición 


L(0, y) = mín máx L (8, w. (9-10) 
a 


Ejemplo 9-4. Hallemos la estrategia de minimax del estadista en el pro- 
blema de la linea tecnológica Como la solución debe hallarse en la clase de es- 
trategias admisibles, es suficiente limitarse al análisis de las estrategias defini- 
das por las relaciones (9-8) y (9-9) y que corresponden a los segmentos CCa 


LA 


Nu ao 


o $ / 


b) 


Fig. 9-3. Determinación de la estrategia óptima por el principio de minimax (a. 
corresponde al segmento CıCz y b, al segmento C:Cs en la fig. 9-1) 


Y G:C» de la envoltura convexa S» dada en la figura 9-1. Conforme a estas ro- 
Jaciones y segmentos, en la figura 9-3,a y b se han construido las gráficas 
L(0,m) en la función de w para 0 =0, y O= 9 Los valores máx L(0,m) 


están marcados con lineas gruesas. Como se ve en las figuras, el minimo de 
esta magnitud se alcanza igual a 3 en el segmento C:Cz. y en el segmento 
CıCs se determina por la condición de que se intersecan dos rectas 

320 =2+w, 
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es decir, se alcanza con w = !/s y es igual a /s < 3. De este modo, el princi- 
pio de minimax da un punto en el segmento CC, correspondiente a w = l/a, 
o sea, determina la estrategia mixta óptima n° = (0.1/s,%/3) con la cual las 
pérdidas del estadista no serán mayores que la magnitud */, con cualquiera 
estrategia de la naturaleza 


A veces es racional elegir la estrategia no partiendo de las pér- 
didas totales L(0, a) sino de las llamadas pérdidas complementa- 
rías L’ (da) que se definen por las relaciones 


L'(0, a)=L(0, a) — mín L (0, a). (9-11) 


Para cada estado de la naturaleza la magnitud mín L(, a) 
a 


determina las pérdidas mínimas que el estadista sufre obligatoria- 
metne, incluso con su mejor operación, es decir, las pérdidas ne- 
cesarias. Puede considerarse que las pérdidas necesarias se com- 
pensan de una u otra forma (por ejemplo, fijando los precios 
adecuados de la producción) y pueden dejar de tomarse en cuenta 
al elegir la estrategia. En este caso la elección de la estrategia 
puede realizarse según el principio de 

minimax de las pérdidas complementa- Tabla 9-3 


rias» Pérdidas complement 
Ejemplo 9-5. Las pérdidas complementarias en el problema de la 
on el problema de ta, línea, tecnok tecnológica 
o 


en Ja tabla 9-3. Aplicando a los datos de esta 
tabla el principio de minimax, obtenemos en ca: 
lidod de estrategia óptima la estrategia pura as 
con las pérdidas 1. 


- Los principios de minimax que par- 

ten de la suposición de que la naturale- p o 1 3 
za obra del peor modo para el estadista, t 3 1 0 
están justificados en los juegos estra- 

tégicos, pero en los juegos estadísticos 

expresan realmente el punto de vista de una persona muy cuida- 
dosa que trata de obtener aunque sea algo de lo alcanzable y no 
persigue el máximo para no sufrir grandes pérdidas aleatorias. 
Es necesario considerar también una desventaja de los paseo 5 
de minimax debido a que éstos no tienen en cuenta la información 
apriorística sobre el estado de la naturaleza y con ello limitan la 
ganancia que puede proporcionar dicha información. 

Por eso, los principos de minimax pueden recomendarse en los 
casos en que falta información aprioristica sobre los estados de la 
naturaleza o existe fundamento para dudar de que la información 
sea cierta. 

Otro principio de elección de estrategia que toma en considera- 
ción la distribución apriorística de tas probabilidades £(0) es el 
de Bayes. Según este principio la estimación de la estrategia mixta 
del estadista n(a) se realiza promediando las pérdidas L(0, n) 
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por todos los estados posibles de la naturaleza 0 e O teniendo en 
Cuenta la distribución apriorística de las probabilidades §(0), es 
decir, por la magnitud 


LE. 1=2 L(0, m8 (0). (9-12) 


Por cierto, la mejor estrategia y (a) será aquella que propor- 
ciona el miinimo de la magnitud L(E, n). Esta estrategia óptima 
se denomina estrategia de Bayes. 

Naturalmente, el principio de Bayes puede aplicarse tanto a las 
pérdidas totales como a las complementarias. Sin embargo, en los 
ejemplos ulteriores nos limitaremos solamente a aplicar el prin- 
cipio de Bayes a las pérdidas totales. 


Ejemplo 9-6. En el problema de la linea tecnológica con £(01) = 0,6 y 
E(02) = 0.4, para las estrategias admisibles determinadas por el segmento C1C2, 


Tenemos: 
LE n= (1 — 0) 0,6 + (3 + 2 w) 0,4 == 1,8 + 2,0 w; 
de manera que mín L(E.m) = 1,8 con w = 0, lo que corresponde a la estra- 
tegia mixta n = (0, 1,0); para el segmento C:Cs 
L (Es n) = 2,6 — 0,86, 


de suerte que min L(, n) = 1,8 para w = 1, lo que corresponde a la misma 


estrategia mixta n = (0, 1,0). De este modo, la estrategia pura az es una es- 
trategia de Bayes. 

Es necesario notar que el resultado obtenido no es aleatorio. Más adelante 
mostraremos que el principio de Bayes siempre brinda en calidad de estrate- 
fa óptima una de las estrategias puras del estadista. Entonces la operación de 

ayes a* se determinará por la condición (9-3). 


d) Interpretación geométrica de las estrategias 
de Bayes 


Examinemos el juego estadístico S para los dos estados de la 
naturaleza 0, y 02, determinado por la zona convexa S* en el 
plano (x, y) mostrado en la figura 9-4, donde 


x= Litn); y= L (8z, n). (9-13) 


Como sabemos, las estrategias admisibles se hallan en el li- 
mite inferior izquierdo de la zona S*. Examinemos una de las 
estrategias So. Construyamos el conjunto auxiliar R que contiene 
todos los puntos que se encuentran más abajo y a la izquierda del 
punto So. Evidentemente que S* y R son conjuntos convexos y nin- 
gún punto de S*, incluso el punto So, pertenece a R. 

Tracemos la recta que divide los conjuntos S* y R. Esta recta 
debe pasar a través de Sp, es decir, debe ser la recta de referencia 
al conjunto S* en el punto Sa. Pero ella debe ser también recta de 
referencia para el conjunto R. Luego, dicha recta deberá tener pen- 
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diente negativa, ser vertical u horizontal, y su ecuación puede es- 
cribirse en la forma 


y=—kx pc, k>0. (9-14) 


Al dividir ambos miembros de esta ecuación por k- 1 la re- 
ducimos a la forma 


artby=c, (9-15) 
donde F 
1 e 

a Pa. STET (9-16) 

Notando que a = 0, b = 0, a +b = 1 podemos hacer a = w, 

b = I — w y considerar w y i — w como probabilidades aprioris- 
ticas de los estados de la naturaleza ® y 02: 

w=E(6)), 1—w=E(0%). (9-17) 


En este caso la ecuación de la recta de referencia puede escri- 
birse en la forma 


wr + (l — w) y =e (9-18) 


L(01, n) 5 (81) + L (O2, n) E (0a) = (9-19) 


Como vemos, la magnitud c” determina las pérdidas medias 
L(é, n) con las probabilidades aprioristicas de los estados de la 
naturaleza §(0:) = w y £(0)= 1—w. 
Es fácil notar asimismo, que la magni- 
tud c’ para el punto Sọ es el minimo 
de todos los valores posibles de LE n), 
ya que el aumento de c” hasta c > 
significa que la recta pasará "más 
arriba y va a pasar por los puntos 
del conjunto S* que no son admisibles 
y la disminución de c' no es posible, 

a que la recta descenderá y no va a Fig, 9-4, Construcción de la 
ener puntos comunes con S*. De este linea de apoyo al conjunto 
modo la magnitud c” determina la estra- convexo 
tegia n que da un minimo de pérdidas 
medias L(Ẹ, n) con la distribución dada ma 1—w), es de- 
cir, determina la estrategia de Bayes para la distribución apriorís- 
tica de probabilidades dada. 

Por cuanto So constituye un punto arbitrario en el límite de las 
estrategias admisibles, para cualquier punto de este límite pueden 
encontrarse tales w y I — w para las cuales este punto va a de- 
terminar la estrategia de Bayes. De aquí se deduce que cada estra- 
tegia admisible constituye la estrategia de Bayes para ciertas 
probabilidades apriorísticas w y 1 — w. 

Supongamos ahora que nos han presentado las probabilidades 
apriorísticas de los estados de la naturaleza w X 1— w y se re- 
quiere hallar el punto en la envoltura convexa 3* que determina 


o bien 
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u estrategia de Bayes para este caso. Tracemos en el plano (x, y) 
a recta 


ex+(l—)y=0. (9-20) 


Con una c arbitraria esta recta será paralela a la recta de 


referencia en el punto correspondiente a la estrategia de Bayes. 

Para facilitar el trazado, supongamos que ¢ = w(l — w), y escri- 
bamos la ecuación (9-20) en la forma 
Y 

a+ => (9-21) 


que representa la ecuación de una recta en segmentos. En la fi- 
gura 9-5 está trazada la recta correspondiente a la ecuación 

(9-21). Ahora ya es fácil trazar la recta 
de referencia correspondiente a los valores 
dados de w y 1—w que determina en la 
envoltura convexa S* el punto correspon- 
diente al a estrategia de Bayes del esta- 
dista. 

Por cuanto el limite exterior de la en- 
voltura convexa es un polígono con los 
Fig. 9-5 Determinación  Véritces correspondientes a las estrategias 
geométrica de la estrate- puras del estadista, la recta de referencia 


gis de Bayes pasa obligatoriamente por uno siquiera de 
los vértices. Luego, para las probabilida- 
des aprioristicas dadas w y | —w siempre existe al menos una 


estrategia de Bayes que es pura. Esta circunstancia simplifica 
muchísimo la resolución de los juegos estadísticos ya que al bus- 
car la solución de Bayes, permite limitarse a examinar sólo un 
número finito de estrategias puras admisibles en lugar de un con- 
junto infínito de estrategias mixtas. Esto satisface también a 
muchos estadistas de ánimo ssp que están en contra del 
empleo de las estrategias mixtas fundándose en que con ellos se 
requiere utilizar un mecanismo de elección aleatoria que no guarda 
relación con la esencia del problema. 

Por supuesto que todas las deducciones hechas siguen siendo 
válidas cuando existen más de dos estados de la naturaleza. Pero 
entonces ya es imposible el análisis en el plano lo que dificulta la 
ilustración geométrica de estos casos. 


9-3. JUEGOS ESTADÍSTICOS CON REALIZACION 
DE UN EXPERIMENTO UNICO 


a) Enunciado del problema 


Como se ha señalado ya la peculiaridad de los juegos estadi 
ticos es que el estadista puede profundizar y precisar sus conoci- 
mientos respecto al estado de la naturaleza efectuando un experi- 
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mento. En principio, si el estadista tuviera la posibilidad ilimitada 
de experimentar, obtendría información completa sobre el estado 
de la naturaleza y obraría en condiciones de plena determinación. 
No obstante, el montar un experímento siempre acarrea gastos de 
recursos y tiempo, cuyas pérdidas pueden resultar más cuantiosas 
que el beneficio obtenido del experimento. 

La posibilidad de realizar el experimento amplía extraordina- 
riamente la clase de las estrategias del estadista. Ante todo, el 
estadista debe tomar la decisión de efectuar o no efectuar el ex- 
perimento. Luego, tiene que decidir de qué naturaleza debe ser este 
experimento, cuántas pruebas diferentes será necesario realizar 
antes de considerar terminado el experimento y qué medidas hay 
que tomar al obtener unos u otros resultados del experimento. 

Trataremos de responder a algunas de estas interrogaciones en 
los párrafos siguientes. En el párrafo dado centraremos nuestra 
atención en los juegos estadísticos con experimento único. 

Por ahora no vamos a incluir en la clase de estrategias del 
estadista la toma de decisión sobre la realización del experimento 
considerando que ya se ha tomado la decisión de efectuar el expe- 
rimento único. Por cierto, vamos a entender por experimento único 
aquel cuya extensión y orden de realización se han determinado 
previamente. Así pues, en caso de ser necesario comprobar si es 
simétrica una moneda dada, puede efectuarse el experimento único 
consistente en lanzar n veces la moneda. El resultado del experi- 
mento con n = 5 puede ser la secuencia JPJJP, Existen solamente 
2n de estas secuencias, es decir, en el caso dado el espacio de re- 
sultados del experimento consta de 2% elementos. Análogamente, 
al comprobar un arma se entiende por experimento único aquel 
durante el cual se hacen n disparos. Para estimar cómo influye 
sobre un animal cierto tipo especial de alimento, puede realizarse 
el experimento único consistente en medir durante varios meses 
el aumento de peso diario en n animales, etc. Aunque en estos 
ejemplos el experimento consta de diferentes subpruebas, lo deno- 
minamos único ya que el número de subpruebas y el carácter de 
cada una están determinados de antemano. 


b) Espacio muestral 


Desigrniemos por Z el espacio de resultados del experimento. 
Los elementos de dicho espacio, o sea, los distintos resultados del 
experimento serán Zi, ..., Zy. 

Los distintos resultados del experimento z Æ Z se hallan rela- 
cionados con los estados de la naturaleza $ e O. Esta relación 
consiste en que para cada estado de la naturaleza 0 = O hay una 
probabilidad determinada pe(z) de: que el resultado del experi- 
mento será la z = Z dada. Las magnitudes pp (2), que a veces se 
designan como p(z|0), representan la distribución convencional 
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de probabilidades en el espacio Z con la Ú dada y obedecen a las 
relaciones 


Po(2)>0; z Polz) (9-29) 


El total de los tres elementos: espacio de resultados del experi- 
mento Z, espacio de estados de la naturaleza O y distribución de 
probabilidades pe (2) en el espacio Z con Y = O dada se denomina 
espacio muestral y se designa por 


3=(2, 9, p). (9-28) 
Es cómodo presentar el espacio muestral en forma de tabla 


que contiene la distribución py (z) en el producto directo de los 
conjuntos O X z. 


Ejemplo 9-7 En el problema de sustitución del equipo el experimento puede 
consistir en realizar las pruebas del equipo por los medios de la empresa. En 
este caso la insuliciente calificación del personal y falta de los aparatos de me- 
dición requeridos provocan que los resultados de las pruebas sólo reflejen apro- 
ximadamente el estado del equipo. Supongamos que el experimento puede tener 
cuatro resultados: 

Zs, el equipo está en buenas condiciones; 

Za, se requiere una reparación corriente; 

Za, se requiere cambiar las piezas desgastadas; 

Za, el equipo no sirve para su explotación ulterior. 

Las probabilidades de cada uno de estos resultados, en distintos estados de 
la naturaleza, se ofrecen en ta tabla 9-4 que representa el espacio muestral para 
el problema considerado. 

Ejemplo 9-8. En el problema de la línea tecnológica el experimento puede 
consistir en el análisis preliminar aproximado de las impurezas contenidas (no 
es posible realizar un análisis de laboratorio preciso, ya que requiere grandes 
pérdidas de tiemplo lo que significa horas muertas para el equipo). Los resul- 
tados del experimento son: zı, no se han descubierto impurezas; ze, hay pocas 
impurezas; zs, hay muchas impurezas. Entonces, el espacio muestral puede te- 
ner el aspecto de Ía tabla 9- 


Tabla 9-4 Tabla 9-5 
Espacio muestral en el problema Espacio muestral en el 
de sustitución del equipo problema de la línea 


tecnológica 


p Y Y 0 o 
%|o[|ís|"j|jo o, | os0|o025| 0: 
%ljiot|o[|íl|s o, | 020 | 0,30 | 0,50 


c) Función de decisión 


En el problema sin experimento el estadista debía tomar una 
decisión del espacio de decisiones A, basándose en la información 
apriorística £(0) sobre los estados de la naturaleza. En el pro- 
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blema con experimento el mismo toma la decisión según el resul- 
tado del experimento z€ Z. Para formalizar este problema, él 
puede analizar por anticipado todos los resultados posibles del 
experimento y formular la regla d que determina cuál decisión 
as A debe tomarse con cada resiltado posible del experimento 
zæ Z. Esta regla representará el reflejo del espacio de resultados 
del experimento Z en el espacio de decisiones A 

d:Z>A, (9-24) 
lo que puede escribirse también en la forma 

dí2)=a. 

Se denomina función de decisión la regla d(2) que determina 
la decisión a Œ A que debe tomar el estadista con cualquier resul- 
tado del experimento z = Z. 

Aclaremos el concepto de función de decisión con el ejemplo 
siguiente. Supongamos que el espacio de decisiones consta de tres 
elementos A = (a,, az, as) y el espacio de resultados del experi- 
mento, de cinco Z = (21, 22, Zs, 24, 25). La función de decisión 
d(z;)= a, puede presentarse en forma de conjunto de pares de 
subindices (i, j), que determinan la decisión a; con el resultado 
del experimento 2;. La función de decisión será, por ejemplo, el 
conjunto {(1, 1), (2,1), (3,2), (4,2), (5, 3)); que significa que con 
los resultados 2, y 22 se toma la decisión a, con los resultados Zs 
y z, se asume la decisión az y con el resultado 25 se toma la deci- 
sión as. Claro que la función de decisión dada no es la única po- 
sible, Sería posible asimismo examinar las funciones de decisión 
del tipo ((1, 1), (2, 2), (3, 2), (4, 3), (5, 3)) ó ((1, 3), (2, 1), (3, 2), 
(4, 3), (5, 2)), etc. De acuerdo con esto conviene introducir el es- 
pacio D que contiene la enumeración completa de las funciones de 
decisión posibles y denominarlo espacio de funciones de decisión. 

La función de decisión examinada más arriba fracciona el con- 
junto Z en subconjuntos no intersecados Sat, a saber: 


SaS {z 20), Sa =(29 24), Sa fz). (9-25) 


En términos de la teoria de conjuntos puede decirse que es 
posible considerar cualquier función de decisión d E D como frac- 
cionamiento del espacio de resultados del experimento Z en sub- 
conjuntos no intersecados Sa tales que 


Sa={z:d(2) =a}, aE A. (9-26) 

En particular, si el espacio de decisiones A consta sólo de dos 
elementos a, y a (problema de dos alternativas), la función de 
decisión d(z) fracciona el espacio Z en el S, llamado dominio 


crítico y en su complemento C(S)= 5 que se determina por las 
condiciones 


an sizes; 


a=( de. si 2=C(S). 


(9-27) 


287 


El concepto de función de decisión posibilita formular más pre- 
cisamente la tarea del estadista. Esta tarea consiste en escoger 
del espacio de funciones de decisión D aquella función d(z) que 
permite tomar las decisiones más ventajosas. Pero para esto es 
necesario saber estimar las diferentes funciones de decisión lo que 
puede hacerse con ayuda de la función de riesgo. 


d) Función de riesgo 


Si el estadista realizó la elección de cierta función de decisión 
d(z), con esto él determinó para cada resultado del experimento 
zÆ Z la decisión a = d(2) a la que con $ & 9 van a conrrespon- 
der las pérdidas 

L(0, a) =L[90, d (2)] = Lz (®, d). (9-23) 

No obstante, con una Y dada el resultado del experimento 2 
será una magnitud aleatoria definida por la distribución de pro- 
babilidades po (z) en el espacio Z. Luego, para la z dada van a 
ocurrir con la misma probabilidad po (z) las pérdidas L,(0, d) que 
de este modo serán también una magnitud aleatoria. 

Por cuanto, para estimar la función de decisión d(2) con el 
estado dado de la naturaleza ® hay que tomar en cuenta todos los 
resultados posibles del experimento, es necesario referirnos a las 
pérdidas medias determinadas en todo el espacio de resultados del 
experimento Z. Estas pérdidas medias se denominan función de 
riesgo, se designan por p(0, d) y se determinan por la relación 


p(0, d) =M,[L¿(0, d)]= pa La(®, d) po (2). (9-29) 


A cada estado de la naturaleza 0 € O y cada función de deci- 
sión d e D les corresponderá su valor de pérdidas medias, es de- 
cir, la función de riesgo p(0, d) que, de este modo, se determinará 
en el producto directo de tos conjuntos O X D en forma completa- 
mente análoga a como la función de pérdidas L(0, a) en el juego 
sin experimento se determinó en el producto directo de los conjun- 
tos O X A. De esto se deduce que el espacio de las funciones de 
decisión D y la función de riesgo po, d) en el juego con experi- 
mento único juegan el mismo papel que el espacio de decisiones A 
y la función de pérdidas en el juego sin experimento. De aquí se 
infieren métodos análogos para resolver estos dos problemas. 

En los juegos con experimento único el estadista puede usar 
también estrategias mixtas. Para esto debe disponer de un meca- 
nismo de elección aleatoria que determine la distribución de pro- 
babilidades y (d) en el espacio D. La función de riesgo, al utilizar 
la estrategia mixta n(d) designada en este caso por p(0, n), se 
obtiene promediando p(0, d) por todas las estrategias puras que 
forman parte de la estrategia mixta dada. De este modo, 


p(0, 1) = Ma lp (0, d) = 2 p(0, din (d) (9-30) 
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Tabla 9-6 


Pérdidas y probabilidades de resultados del experimento en el problema 


de la línea tecnológica 


a Pi 
o 
> o 1 3 0,60 0,25 0,15 
O 5 3 2 0,20 0,30 0,50 
o tamando en consideración (9-29) 
p (©, n = 2,L.(0, d) polz) mía). (9-31) 


Naturalmente, al buscar la mejor estrategia en el juego con 


experimento único el estadista debe par- 
tir solamente de las estrategias admi- 
sibles que se determinan exactamente al 9 
igual que en el juego sin experimento. 


Ejemplo 9-9, Determinemos la función de 4 
riesgo en el problema de la línea tecnológi 
Para facilitar los cálculos, reduciremos a ui 
tabla (tabla 9-6) las pérdidas del estadista 3 
L(0,a) y las probabilidades de los resultados 


27 


Hay. une] 


del experimento po(2) dadas en las tablas 9-2 
y 9. 


Por cuanto el espacio de resultados delex- Z 
perimento consta de tres elementos, la función 


de decisión va a tener la forma d(z) = 
= (as, as, an) == desa, donde as, ay y aa signi- / 
fican las "decisiones que debe tomar el estadis- 
ta con los resultados del experimento zi, 23 y 
2,, respectivamente, Así, la función de decisión 
dia significa que con los resultados del expe- g 
rimento 21, 22 y za el estadista toma las deci- 


1 20%) 
E E 3 


siones ai, s Y ds. Fig. 9-6. Función de riesgo 
Los valores de la función de riesgo, calcu- €n el problema de la línea 


lados por las fórmulas (9-29) para cada fun- 
ción de decisión, se exponen en la tabla 9-7 


tecnológica 


la figura 9-6. Examinemos con el ejemplo del cálculo de P(O, di), los datos 


obtenidos de esta tabla. Según (9-29) tenemos: 
PO dia) =La, (0, din) Po (2) + La, (0, di) X 
X Po (22) + La, (0, diaa) Po (2) = L 


(® a) X 


X Po (21) + L (0. a3) Po (23) + L (0 a3) Pa (23). 


Suponiendo que Y = 0, y © = 0», obtenemos: 


P (Ôi 4122) =0,44, p A02 di2) = 3,4. 
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Tabla 9-7 
Valores de la función de riesgo 9 (0, d) en el problema de la línea 


tecnológica 
> dm | dm | dn | da | dm | dm | dm | dm 
A 000 | 0.15 | 05 | 025 | 0,40 | 070 | 0,75 | 0,90 | 1,20 
d 5,00 | 4.00 | 350 | 440 | 3,49 | 2,90 | 4,10 | 3.10 | 2,60 
Continuación de la tabla 9-7 
o dm | dm | dn dm | dm | dm | dw | dm | dm 
PAOA EGE PaE UREDE P A 
h o60 | 0,75 | 105 | 085 | 100 | 130 | 1,35 | 1,50 | 1,80 
0 460 | 3,0 | 3.10 | 400 | 300 | 2,50 | 3,70 | 2,70 | 2,20 
Continuación de la tabla 9:7 
o dm | du | dm | dm | dm | dms | dm | dm | dm 
o 1,80 | 195 | 2,25 | 205 | 220 | 250 | 2,55 | 2,70 | 3,00 
t 440 | 340 | 290 | 380 | 280 | 2,30 | 3,59 | 2.50 | 200 


e) Principios de elección de la estrategia 
en los juegos con experimento único 


Por cuanto la introducción de la función de riesgo reduce el 
juego con experimento único a una forma análoga al juego sin 
experimento, todos los principios de elección de estrategia en el 
juego sin experimento se mantienen vigentes para el caso dado, 
con la diferencia de que en lugar de minimizar las pérdidas medias 
el estadista debe ahora minimizar el riesgo medio. 

El principio de minimax consiste en elegir la estrategia n (d) 
con la que PEA medio p(0, 1) sea el minimo en el peor estado 
de la naturaleza para el estadista, es decir, la elección de la estra- 
tegia de minimax n* se realiza por medio de la condi 


p(0,1)= mín máx p(0, n). (9-32) 


Al determinar el riesgo medio p(0, n), si partimos de las pérdi- 
das no completas sino de las complementarias L*(0, a), la fórmula 
(9-32) definirá el principio de minimax de las pérdidas comple- 
mentarias. 
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Para aplicar el principio de Bayes, introduzcamos el concepto 
de riesgo esperado, por el que se entiende el riesgo medio tomando 
en consideración todos los estados posibles de la naturaleza Y € O 
y la distribución apriorística de las probabilidades en el espacio 0, 
Como que el estadista, al utilizar d principio de Bayes, puede li- 
mitarse a emplear solamente estrategias puras, el riesgo esperado 
es 


pE. d =F pð, d)E(0). (9-33) 


El principio de Bayes requiere el empleo de una función de 
decisión d* con la que será mínimo el riesgo esperado, denominado 
en este caso riesgo de Bayes: 


(==. ( 4)=minp(, d). (9-34) 


Ejemplo 9-10. Determinemos las estrategias, de minimax y Bayes en el 
problema de la línea tecnologica con realización de experimento único, En la 
figura 9-6 este problema se ha presentado en forma del juego S. Gracias a la 
construcción geométrica dada resulta fácil establecer que la estrategia de mi- 
nimex se determina por, el punto So con las coordenandas (lia 3/1), y co 
responde al empleo de las estrategias puras dass y dss con las probabilidades 
1/4 y /1w La estrategia diza será la estrategia de Bayes. 


9-4. UTILIZACIÓN DE LAS PROBABILIDADES 
APOSTERIORISTICAS 


a) Determinación del número de estrategias 
en los juegos con experimento 


En los ejemplos de los párrafos anteriores se ve que en los 
juegos estadísticos la realización del experimento conduce al 
aumento considerable del número de estrategias puras del esta- 
dista. Asi pues, en el problema de la línea tecnológica, al tomar en 
consideración los resultados del experimento, el número de estra- 
tegias puras creció de 3 a 27. Si no resultara posible representar 
este juego en el plano en forma de juego S surgirían serias dificul- 
tades en su análisis. 

Designemos por N el número total de estrategias puras del 
estadista en el juego con experimento único. No es difícil calcular 
este número. Supongamos que en el juego sin experimento, el 
estadista puede tomar [ decisiones posibles as, , @ y el número 
de resultados posibles del experimento es igual a v. 

Con v = 1 obtenemos un juego en el que se sabe por anticipado 
el resultado del experimento lo que es equivalente al juego sin 
experimento con N = l. 

Con v = 2 la estrategia del estadista puede escribirse en la 
forma d= (a, 4) en que las magnitudes a;, y as, pueden ser cua- 
Jesquier a Œ A. Por consiguiente, puede haber / valores diferentes 
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de ar, a cada uno de los cuales pueden corresponder £ valores di- 
ferentes de arn de modo que N = P. 

Con v = 3 la estrategia del estadista es d= (a, am au). El 
total de soluciones a,, y an puede adoptar [2 valores a cada uno 
de los cuales pueden corresponder / valores distintos de ay, de 
suerte que N =P, 

Al proseguir razonando análogamente llegamos a la conclusión 
de que con ¿ y v arbitrarias el número total de estrategias puras 
es de N = ly. El número de estrategias puras del estadista con 1 
y y grandes puede resultar tan considerable que surgirán serias 
dificultades relacionadas con su análisis. 

En tales casos podemos lograr una gran simplificación en la 
búsqueda de las estrategias de Bayes si en lugar de la distribución 
aprioristica de probabilidades empleamos la aposteriorística cal- 
culada basándonos en los resultados del experimento efectuado. 
Con esto, el número de estrategias puras del estadista en el pro- 
blema con experimento se mantendrá al igual que en el problema 
sin experimento. 


b) Distribución aposteriorística de probabilidades. 
Fórmula de Bayes 


La distribución apriorística de probabilidades E(0), obtenida 
fundándose en los datos y la experiencia del pasado, brinda in- 
formación útil sobre la frecuencia con que, en general, se presenta 
uno u otro estado de la naturaleza independientemente de las con- 
diciones concretas en que el estadista tiene que tomar la decisión. 
El objetivo del experimento llevado a cabo por el estadista es reci- 
bir información adicional acerca del estado real de la naturaleza, 

Supongamos que el espacio de resultados del experimento es el 
conjunto Z= (21, ..., Zy}. En este caso el resultado del experi- 
mento concreto será aleatorio y por eso tampoco permite determi- 
nar con precisión el verdadero estado de la naturaleza. No obstan- 
te, la indeterminación respecto al estado de la naturaleza dismi- 
nuye notablemente si el experimento se ha realizado de forma 
correcta. 

Este cambio de la indeterminación respecto al estado de la na- 
turaleza consiste en que a resultas del experimento, en lugar de la 
distribución aprioristica E(6) se obtiene una nueva distribución de 
probabilidades E,(0) que se denomina distribución aposterioristica 
de probabilidades en el espacio O con el resultado concreto dado 
del experimento 2 € Z. Ocupémonos de los métodos de cálculo de 
la distribución apriorística de probabilidades. 

Ante todo, notemos que el resuitado del experimento que tiene 
por objeto precisar el estado real de la naturaleza, dependerá del 
estado de la naturaleza 0. El estudio preliminar de las condiciones 
en las cuales se realiza el experimento permite indicar para cada 
estado de la naturaleza 0, la distribución de probabilidades en el 
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espacio de resultados del experimento Z que, de esta suerte, va a 
sopas la distribución condicional de probabilidades p (Z |0) = 
= py (2). 

Para describir de forma completa un experimento concreto hay 
que conocer el resultado del experimento z € Z y el estado de la 
naturaleza ® e © con el cual se realizó el mismo. Luego entonces, 
el resultado de un experimento concreto puede representarse en 
forma del par ordenado (z, 0), que constituye un elemento del 
producto directo de los conjuntos Z X ©. 

Designemos por g(z, 0) la distribución de probabilidades en el 
conjunto Z X ©. En el caso general esta distribución de probabili- 
dades va a variar al cambiar la distribución apriorística de pro- 
babilidades £(0), es decir, será función de E. Para la distribución 
apriorística concreta E(0) designaremos la distribución de probabi- 
lidades en el conjunto Z X 8 por g;(z, 0). 

Nos es necesario relacionar entre sí las distribuciones £(0), 
Po (2). E,(0) y qr (2, 0). Ya hemos tropezado con un problema simi- 
lar al examinar las magnitudes aleatorias bidimensionales en las 
que el resultado del experimento z era el par ordenado (x, y). 
Para estas magnitudes aleatorias se cumple la relación (8-37) 
que, al aplicarse a nuestro caso, puede escribirse en la forma 


qu (z, 0) = po (2) E(0) = è: (0) p (2). (9-35) 
De aqui hallamos que aito 
Po (2 
E a (9-36) 
En esta expresión p(z) representa la probabilidad incondicional 
del resultado dado del experimento z, es decir, la probabilidad de 
que vaya a ocurrir el resultado z en un estado arbitrario de la na- 


turaleza, Partiendo de esto, la probabilidad p(2) puede presentarse 
del modo siguiente: 


Pl)=p(10,U02U ... U0m). (9-37) 


Aplicando a esta expresión la fórmula de la probabilidad com- 
pleta (5-42), obtenemos 


plz) = X po(z)3 (0). (9-38) 


Teniendo en cuenta (9-38) la fórmula para determinar la distri- 
bución aposteriorística de probabilidades E-(0) adquiere el as- 


pecto: ral 
z 
AGO (059) 


0) = ———: 
tto) ARTO] 


En la teoría de las probabilidades esta fórmula recibió la deno- 
minación de fórmula de Bayes. 
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Ejemplo 9-11. Determinemos la distribución aposterioristica de probabili- 
dades en el pronlema de le línea fecnológica, Realicamos Jos cálculos negin 
Ja fórmula, (6-39) por el método tabular, El proceso del cálculo se brinda en 
la tabla 9-8. 


Tabla 9-8 


Cálculo de la distribución aposterlorística de las probabilidades 
en el problema de la línea tecnológica 


ata Potto Ro 
to 
z wj ax a 
% 0,6 0,60 | 0,25 | 0,'5| 0,36 | 0,15 | 0,09 | 0,818| 0,555|0,:1) 
de o4 | 0,20 | 0,30 | 0,50 | 0,08 | 0,12 | 0,20 | 0,182 | 0,445 |0,690 


Po (2) (0) 


041 | 0,27 | 0,29 


Sirven de datos de partida para esicular la, distribución apriorística de probabi- 
lidades E(0), tomada de la tabla 9-2 y la distribución condiciona) de probabili- 
dados po (z) tomada de 9-5. 

El valor hallado de las probabilidades aposteriorísticas demuestra que con 
los resultados del experimento zı o zs disminuye grandemente la indetermina- 
ción respecto a los estados de la naturaleza 

No obstante, con el resultado z la indeterminación se vuelve incluso mayor 
que antes de realizar el experimento 


€) Principio de verosimilitud máxima 


El conocimiento de las probabilidades aposteriorísticas permite 
estimar el estado de la naturaleza utilizando el principio de vero- 
similitud máxima. Según este principio se toma como estimación 
del estado de la naturaleza Ú aquel que parece el más probable 
basándose en los datos experimentales. 

Ejemplo 9-12. Estimemos el estado de la naturaleza Ú en el problema del 
proceso tecnológico siendo z, el resultado del experimento. De acuerdo con la 


tabla 9-8 las probabilidades aposteríorísticas de los estados de la naturaleza O 
y 0% con el resultado del experimento 24 son: 


Ez, (0) =0,818, E, (07) = 0.182. 


Por cuanto el máx [8,, (0,), 8z, (02)] =8,, (01), en virtud del principio de 
verosimilitud máxima Ë = ð. 
El principio de verosimilitud máxima se utiliza frecuentemente para ele- 
gir la decisión en el problema de dos allernativas. En este problema el espacio 
le estados de la naturaleza consta de dos elementos: © = (01,02) con dis- 
tribución apriorstica de los probabilidades (0) == (%, i — £). El espacio de de- 
cisiones del estadista también está compuesto de dos elementos A = (01, az), 
donde a, es la decisión de que la naturaleza se halla en el estado 01; a, es la 
decisión de que la naturaleza se encuentra en el estado 0. Se conocen también 
las distribuciones condicionales de probabilidades de los resultados del experi- 
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mento po(2) para © =0, y O= 0, Por los resultados del experimento z = Z 
es necesario tomar la decisión a e {2,, a2}. 


Ejemplo 9-13, Problema de la estación de radiolocalización (E. R. L.). La 
señal puede surgir en la pantalla de la E. R, L; como resultado de la presencia 
del objetivo en la zona de acción de la É R. L. o a causa de la influencia de 
interferencias de diversa fadote. Por consiguiente, pueden tener lugar dos es- 
tados de la naturaleza: 01, hay objetivo; dz, no hay objetivo. Al mirar la pan- 
talla puede tomarse una de las dos decisiones: ar, hay objetivo; as, no hay ob- 
jetivo, Con esto pueden cometerse errores de dos tpos: 
a: |Ú2, el error del primer género denominado a veces “ 
el error del segundo género llamado en ocasiones “ 


objetivo” 
Para tomar la decisión en el problema de dos alternativas se emplea con 
frecuencia la relación de verosimilitud definida por la relación 


Èz (t) 
AUA (9-40) 


Se dice que tiene lugar una comprobación con respecto a la verosimilitud 
si existe un número determinado k tal que se toma la decisión de acuerdo con 
la regla siguiente: 

se toma la decisión a, si 28 >k 

se toma la decisión az si Alz) < k; 

se toma la decisión ay o as si A(z) = k. 

El valor de £ se elige dependiendo de las consecuencias a las que puede 
conducir una decisión errónea. Así pues, en el problema de la E. R. L. el error 
de tipo “falsa alarma” puede acarrear mayores consecuencas que el error 
“no detección del objetivo". Sólo debe tomarse la decisión ay en caso en 
que tengamos una gran seguridad de que en realidad existe el objetivo, es de» 
cir, si se cumple la condición E:(0,) > 8:(04). Esto significa que en el caso 
dado hay que tomar k > 1. 


A(2)= 


d) Determinación de la decisión de Bayes sobre la base 
del empleo de las probabilidades aposteriorísticas 


Como vimos al principio del presente capítulo, la dificultad 
principal para resolver el problema con realización del experimento 
consiste en el brusco incremento del número de estrategias al 
aumentar el número de resultados posibles del experimento. Sin 
embargo, en realidad no hay ninguna necesidad de analizar todos 
los resultados del experimento posibles. Si el experimento efec- 
tuado nos proporciona algún resultado concreto 2 Z, entonces 
hay que resolver el problema para dicho resultado. 

Esto puede hacerse calculando con el resultado dado del expe- 
rimento z la distribución aprioristica de probabilidades £,(0) en el 
espacio de estados de la naturaleza 6. En este caso, se conocerán 
el espacio de estados de la naturaleza ©, el espacio de decisiones A 
y la distribución de probabilidades en el espacio de estados de la 
naturaleza £.(0) en el cual está tomado en cuenta el resultado del 
experimento. Pero éste sólo difiere del problema sin experimento 
en que aquí se utiliza la distribución aposteriorística de probabili- 
dades £.(9) en lugar de la apriorística £(0). Por consiguiente, los 
métodos de resolución de este problema son análogos a los que 
se emplearon en el problema sin experimento. 
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Al emplear las probabilidades aposteriorísticas E, (0) en calidad 
de estrategias puras del estadista se emplean los elementos del es- 
pacio de decisiones A = (a, ..., aj. Con esto a cada decisión 
a EA van a corresponder las pérdidas del estadista L (£n, a) que 
se determinan por analogía con (9-2) como 


LCa a)= Mo; ¿[L(0, a)]=2L(0, a)8, (0) (9-41) 
o teniendo en cuenta (9-39) 


L(0, a) pa (2) 5 (0) 


L a (9-42) 


El principio de Bayes se reduce a elegir tal operación a* = A 
en que sea mínima la magnitud de las pérdidas determinadas se- 
gún (9-42): 


RE)=R (Ez 0) = mín L(a a). (9-43) 


e) Problema de dos alternativas 


Ilustremos los principios expuestos mediante el ejemplo de la 
resolución del problema con distribución apriorística de las proba- 
bilidades E(0=(€, 1—£). Siendo 

Tabla 9-9 correctas las soluciones, considera- 

Pérdidas en el problema mos la pérdidas iguales a cero. El 
de dos alternativas error del primer género (as|0,) da 
una pérdida w y el del segundo gé- 
nero, (a,|03), una pérdida de 1. Con 


> $ + esto, la matriz de pérdidas tiene el 
— aspecto de la tabla 9-9. 

$ o w Examinemos la función de deci- 

de 1 0 sión d(z) que, según (9-27), divide 

el espacio de resultados del experi- 


mento Z en dominios S y C(S) tales 
que se toma la decisión a, si zÆ S y se toma la decisión as, si 
ze C(S). Por cuanto S y C(S) deben ser compactos, la resolu- 
ción del problema se reduce a hallar el límtie que divide el con- 
junto Z en los subconjuntos no intersecados S y C(S). Designe- 
mos por Zo los elementos de z E Z que forman dicho límite. En la 
figura 9-7 se muestra el tipo de límite Zo para los casos unidimen- 
sional y bidimensional. 
Para hallar la ecuación que define el límite Z, escribiremos las 
expresiones para las pérdidas medias estando dadas la z y las de- 
cisiones a; y 42. Tomando en consideración (9-42) y los datos de 
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la tabla 9-9, obtenemos: 
EIN 


ON (9-44) 
(DE e 
La PRREOS e 


El límite zo corresponde a la igualdad de las pérdidas medias 
con las soluciones a, y az to que da: 


(1—8) Po, (20) = wPo, (20) (9-46) 
o bien 
Pp cl w). (9-47) 


Como vemos, a cada valor de £ corresponderá su límite zo y, 
por lo tanto, los dominios correspondientes S} y C(S;). Por cierto, 


y 
z 
Zo A 
2 


Fig. 9-7. Fraccionamiento del espacio de resultados del experimento en el pro- 
blema de dos alternativas 


con la magnitud £ van a determinarse también las probabilidades 
de las soluciones erróneas « (€) y B(£), que son las probabilidades 
de que con 0 = 0, el punto z caerá en el dominio C(Sí) y se to- 
mará la decisión as y la probabilidad de que con 0 == 0» el punto z 
caerá en el dominio Sg y se tomará la decisión a;. Estas probabili- 
dades se determinan por las relaciones 


ag) =P (a10) = ¿Eo poa (9-48) 
E 


Bl) =Pla0)= 2 plz). (9-49) 


Para determinar el carácter de la dependencia de la probabili- 
dad de soluciones erróneas de £, determinemos los valores «(%) 
y B(£) para los valores limites ¢ = 0 y $ = 1. 

Los elementos z e Z que forman parte del conjunto S se deter- 
minan por la condición 

L (ža a) < L Ez a) 


Pol) _ tw 5 
ES E (9-50) 


o bien 
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Con ¿ = 0 esta condición da: 


Po, (2) 

AC 
lo que es posible sólo en el caso de que St = Ø, C(S;)=Z. Con 
esto, mediante (9-48) y (9-49) hallamos que «(0)= 1 y B(0) = 0. 


Con ¿= 1 la condición (9-50) da: 


Po, (2) » 
Po, (2) o, 


lo que determina el dominio S¿=Z, C(S;)= Ø, de modo que 
a(1)=0, B(1)= 1 

De esta suerte, al variar £ de O a 1, «.(£) varía de 1 a 0, y P(t) 
varía de0a L. 

Haltemos el riesgo de Bayes p*(£) para la función de decisión 
para todos los valores posibles de £. Utilizando la expresión (9-29) 
examinada d(z), con Aj objeto de determinar las pérdidas medias 


Y 


Fig. 9-8, Curva del riesgo de Bayes en el problema de dos alternativas 


para la función de decisión p(0, d) y promediando esta función en 
todos los estados de la naturaleza, hallamos que ` 


o O= twa (E) + (1 — T) B (2). (9-51) 


En la figura 9-8 se muestra la gráfica de dependencia de p*(£) 
trazada según esta fórmula teniendo en cuenta el carácter hallado 
de la variación de æ ($) y B(¢). En esta gráfica se ve que p*(£) se 
convierte en cero con b= Ô y ¢ = I, y alcanza su máximo con 
cierta £ = fo. El valor čo determina la peor estrategia de la natu- 
raleza para el estadista, con la cual él, utilizando el principio de 
Bayes, tiene las pérdidas p* (to). 

En la práctica, muy frecuentemente se presentan casos en que 
hay insuficientes datos estadísticos preliminares para determinar 
con exactitud la probabilidad aprioristica £. Por eso, tiene impor- 
tancia hallar la magnitud del riesgo de Bayes para el caso en que 
el estadista parte de cierto valor de la probabilidad apriorística £”, 
y de acuerdo con esto determina las magnitudes Sp, a(g’) y p(t, 
mientras que el valor real de £ será otro. En este caso el riesgo de 
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Bayes se determina por medio de la expresión 
pE, Y) =twa (8) + (1—2B(0), (9-52) 


que es lineal respecto a £ y define la tangente a la curva y = p* (t) 
en el punto ¿ = 1”. En la figura 9-8 se ve que las pérdidas deter- 
minadas por la función p(£, {’), serán mayores que para la función 

*(E) si E e E', de modo que el conocimiento inexacto de la distri- 

ución apriorística de probabilidades provoca el aumento de las 
pérdidas. Es más, si las £ difieren mucho de Y, las pérdidas deter- 
minadas por la función p(£, €) pueden exceder de la magnitud 
p*(to) correspondiente a la magnitud máxima de las pérdidas de 
Bayes. No obstante, si se parte de la distribución de probabilidades 
más desfavorable correspondiente al valor Zo, la función y == 
= p(E, ĉo) va a ser continua y con cualquier £ determina pérdidas 
iguales a p*(£0). Este caso corresponde al empleo de la estrategia 
de minimax. 

De esta manera, únicamente es racional el empleo del principio 
de Bayes en los casos en que se conoce con suficiente exactitud la 
distribución aprioristica de probabilidades £(0). Ahora, si se desco- 
noce o conoce de manera imprecisa la distribución apriorística de 
probabilidades E(0), puede resultar más provechoso el empleo del 
principio de minimax. 


9-5. JUEGOS ESTADISTICOS CON MUESTRAS 
CONSECUTIVAS 


a) Observaciones preliminares 


Al estudiar el juego estadístico con experimento único se señaló 
que éste no constaba necesariamente de una sola prueba. El puede 
consistir asimismo en una secuencia de pruebas, pero deben fijarse 
ponte la extensión y el orden de las mismas. Así pues, si se 

a determinado de antemano que la decisión se toma después de 
que se han realizado N pruebas consecutivas, entonces toda esta 
secuencia de pruebas se considera como un experimento único cuyo 
resultado será la magnitud multidimensional z = (zı, ..., ZN), 
donde z; i = 1. ..., N es el resultado de la prueba i En virtud 
de esto, el juego con experimento único se denomina frecuente- 
mente juego con extensión predeterminada de muestras entendien- 
do por extensión de muestra el número de experimentos realizados 
consecutivamente. 

En los juegos con extensión de muestra predeterminada el 
estadista sólo puede utilizar aquellas estrategias que determinan 
el carácter de sus acciones después de finalizar toda la sucesión 
de pruebas. No obstante, existe otra posibilidad para el estadista. 
Así, en lugar de realizar todas las N pruebas, después de cada 
prueba sucesiva él puede decidir: poner fin a la prueba y elegir de 
entre A cierta decisión, fundándose en la información ya existente, 
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o realizar la prueba apela Esto amplía la clase de las estrate- 
gias posibles del estadista ya que a la elección de la decisión de 
entre el conjunto A se añade además la elección de la decisión de 
terminar o continuar el experimento. Tales juegos se denominan 
juegos con muestra consecutiva. Por cierto, si está determinado 
un número límite admisible de pruebas después de cuya realización 
deberá tomarse obligatoriamente una decisión de entre A, el juego 
se llama de muestra consecutiva truncada. Limitaremos la exposi- 
ción ulterior sólo a estos juegos remitiendo a los interesados en 
un estudio más detallado de la materia a la literatura a propósito. 
Vamos a denominar observaciones a los resultados consecutivos 
separados del experimento. 

Si el experimento no costara nada, no tendría sentido ampliar 
ta clase de estrategias introduciendo muestras consecutivas ya que 
el estadista no perdería nada y al efectuar todas las M observacio: 
nes sólo podría ganar. Pero en muchos casos el experimento es 
costoso y requiere pérdidas de tiempo. Entonces el estadista puede 
obtener una considerable ganancia si en cada etapa del experi- 
mento compara el costo de continuación del mismo con la ganan- 
cia esperada debido a la información adicional obtenida. 

Examinemos el método de descripción del juego con muestras 
consecutivas truncadas. Designemos por Z; el conjunto de resul- 
tados de la prueba ¿i Entonces el espacio completo de resultados 
del experimento Z al efectuar todas las M pruebas puede represen- 


tarse en la forma 
Z=2 X... X Zy. (9-53) 


- En el juego con muestras consecutivas se admite tomar la deci- 
sión basándose en la realización no de todas las M observaciones 


Zi, ..., Zv, Sino únicamente lås primeras j de ellas zs, zj. En 
virtud de esto puede fraccionarse el conjunto Z en subconjuntos no 
intersecados So, Sy, ..., Sy tales que la decisión se toma fundán- 


dose en la realización de las primeras j observaciones si z Œ $y. 

El conjunto S = (So, Sy, ..., Sy) se denomina plan de muestra 
consecutiva. El conjunto Z puede dividirse por varios métodos di- 
ferentes en subconjuntos no intersecados $, Cada uno de estos 
métodos determinará su plan de muestra consecutiva. Designare- 
mos por € y llamaremos clase completa de muestras consecutivas 
al conjunto de diversos planes de muestra consecutiva posibles, 

Para que sea factible la toma de la decisión, hay que presentar 
la función de decisión d(=) que determina la decisión de A 
para cada secuencia de observaciones. Al igual que en el juego con 
experimento único, el estadista elige la función de decisión d(2) 
de entre el espacio de funciones de decisión D del que forman parte 
todas las funciones de decisióri posibles. 

La estrategia del estadista en el juego con muestras conse- 
cutivas consiste, en primera, en la elección del plan de decisión 
consecutiva S = G que indica cuándo debe terminarse el experi- 
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mento, y en segunda, en la elección de la función de decisión 
d E D la cual señala qué decisión debe tomarse al finalizar el ex- 
perimento. De este modo el par (S, d) determina la estrategia del 
estadista. Tomando en consideración que el par (S, d) es un ele- 
mento del producto directo © X D, llegamos a la conclusión de 
que € X D es el espacio de estrategias puras del estadista. 

El número total de estrategias en los juegos con muestras 
consecutivas resulta mucho mayor e en los juegos con experien- 
cia única lo que provoca grandes dificultades al redactar la lista 
completa de estrategias del estadista y elegir la mejor de ellas. 
Este trabajo puede simplificarse considerablemente si en cada 
etapa del experimento se calcula la distribución aposteriorística de 
probabilidades utilizando para ello toda la información acumulada 
hasta el momento dado. A medida que se efectúan las observacio- 
nes consecutivas, disminuye la indeterminación respecto al verda- 
dero estado de la naturaleza ya que surge la posibilidad de ela- 
borar un criterio para determinar el momento de dar fin al experi- 
mento y tomar la decisión de entre él conjunto A. 


b) Utilización de la distribución aposteriorística 
de probabilidades para determinar las reglas 
consecutivas de Bayes 


Solamente examinaremos aquellos juegos estadísticos en los 
ue los resultados de algunas subpruebas 2), ..., Zy son magnitu- 
des aleatorias independientes. Designemos por q4 (2,) la distribu- 
ción de probabilidades en el espacio Z; con el estado de la natura- 
leza dado 0. Vamos a considerar constante e igual a c = | el 
valor de la subprueba aislada. 

En calidad de fundamento para escribir el plan de muestras 
consecutivas tomaremos la distribución de Perea E(0) en 
el espacio de estados de ja naturaleza ©, al hacerlo, por distribu- 
ción £(9) vamos a entender no sólo la distribución apriorística de 
probabilidades antes de iniciar el experimento, sino también la 
distribución aposterioristica de éstas después de realizar varias 
subpruebas. En lo sucesivo vamos a designar por E0(0), la distri- 
bución apriorística de probabilidades y por £,(0), la distribución 
aposteriorística de éstas después de realizar j Subpruebas. 

La distribución de probabilidades E,(0) contendrá en sí toda 
la información sobre el estado de Ja naturaleza Y que se tenía an- 
tes de realizar el experimento y también la que se obtuvo a resul- 
tas de efectuar las primeras j observaciones. Por eso, la distribu- 
ción Es(6) puede considerarse como apriorística antes de la obser- 
vación (j + 1). Luego entonces, la distribución ;4ı (0) se expresa 
por E;(0) con ayuda de la fórmula para la distribución aposterio- 
rística de probabilidades. Vamos a considerar el paso de la dis- 
tribución apriorística de probabilidades 3,(0) a la aposteriorística 
Esa (0) como cierta transformación T de la distribución E,(0). En- 


aol 


tonces la distribución aposterioristica de probabilidades puede 
escribirse según (9-39) en la forma 


—_E(0 oler) 
TOSE O= AA 


Analicemos el principio para obtener el plan de muestra conse- 
cutiva basado en el empleo de la distribución aposteriorística de 
probabilidades, mediante el ejemplo del problema de dos alternati- 
vas en el cual O = (0,02) y A = (a, a} 

Designemos por (£, 1—£) la distribución aposteriorística de 
probabilidades en el espacio O después de realizar varias sub- 
pruebas. En este problema el espacio E de estrategias mixtas de la 
naturaleza se determina por el dominio de valores posibles £, o sea, 
el intervalo (0, 1] del eje real. 


(9-54) 


Decisión sobre 
lacontinuación del 
Decisión a, experimento Decisiona, E 
DAY y Ata) T 


Fig. 9-9, Regla de la toma de decisión en cl problema de dos alternativas 


Puede resultar que £ = 1. En este caso sólo es posible tomar la 
decisión a. Si E = 0 se toma sin falta la decisión ay. Pero si, por 
ejemplo, resulta que ¿ = 0,5, entonces es imposible dar preferencia 
a deci: alguna y hay que continuar el experimento para precisar 
el verdadero estado de la naturaleza. 

Aqui se examinaron casos extremos de distribución de probabi- 
lidades E(0). En el caso general pueden establecerse magnitudes ô 
yr(0<5<1,0<y< 1,5 > y) tales que: 

si £ está en la gama [ð, 1] se toma la decisión ay; 

si ¢ está en la gama (0, y] se toma la decisión az; 

si E está en la gama [y, ô] se toma la decisión de realizar la 
subprueba siguiente. Las gamas A (a) = (6, 1] y A(as)= (0, y] se 
llaman dominios de parada. La regla para tomar la decisión está 
representada gráficamente en la figura 9-9. 

Los dominios de parada pueden determinarse también para el 
zaso en que el número de estados de la naturaleza es mayor de dos. 
Aunque es verdad que entonces el espacio de estrategias mixtas de 
la naturaleza E tendrá una forma más compleja. Así pues, en el 
caso de tres estados de la naturaleza tiene la forma de triángulo 
equilátero con altura igual a la unidad (véase la fig. 9-11). 

En el caso general se llama dominio de parada A(a) en el es- 
pacio E subconjunto de este espacio 


Ala) =E (9-55) 


tal que si después de cierta subprueba resulta que £(0)= A(a), 
entonces se pone fin al experimento y se toma la decisión a, 
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Por cuanto cada subprueba tiene su valor, no será indiferente 
si E(0) cae en la zona A(a) antes de realizar el experimento o des- 
pués de varias subpruebas. Esto significa que con cada nueva sub- 
prueba van a cambiar tanto los valores de E(0) como los dominios 
A(a). Por cierto, en cada etapa del experimento presentan interés 
no aquellas subpruebas que ya se éfectuaron y cuyos resultados se 
utilizaron ya, sino las que quedan por realizar hasta el final del 
experimento. En concordancia con esto designaremos por Ay.¿(a) 
los dominios de parada en la etapá del experimento en que se lle- 
varon a cabo j subpruebas de N. 

Si el espacio de soluciones consta de m elementos 41, ..., am, 
en cada etapa del experimento deben determinarse m dominios 
A(a) correspondientes a cada a € A. Estos dominios deben ser 
convexos y no intersecados. 


c) Regla de las muestras consecutivas 


Supongamos que en el espacio E se han separado m dominios 
A(a) en cada etapa del experimento. Entonces, la regla de las 
muestras consecutivas va a consistir en lo siguiente. 

Inicialmente se conoce la distribución apriorística de probabi- 
lidades Eo(0). Si țo(0) = Ax (a;) para alguna i se toma la deci- 
sión a, sin realizar experimento. Si Eo(0)6£ Ax (ai) con ninguna i, 
se realiza la primera subprueba y se calcula la distribución aposte- 
riorística de probabilidades £,(0). Después, se examinan los domi- 
nios Ay-1(a). Si E:(0)= Ay-1(a1) para alguna i, se pone fin al 
experimento y se toma Ja decisión ar Si E,(0)% Ax- (a) para 
ninguna i, se realiza la siguiente subprueba, etc. 

Por lo general, si no se dio por terminado el experimento du- 
rante las primeras j — 1 observaciones, se realiza una observación 
complementaria y se calcula £,(0). Si E,(0) € Ay-,(as) para cual- 
quier i, entonces se termina el experimento y se toma la decisión ay. 

i la elección no se realizó después de la observación (N — 1) se 
efectúa la observación N y se realiza la elección definitiva. Para 
que se cumpla esta condición los dominios Ao(a;) deben elegirse 

e tal suerte que 


Y ola) =E: (9-56) 


Como vemos, el problema de describir las reglas consecutivas 
de Bayes se reduce a la tarea de determinar los dominios Ay-;(a) 
en el espacio E para todas las a ŒA y para todas las j de 0 a N. 


d) Función de riesgo con la regla consecutiva óptima 


La función de riesgo con muestras consecutivas debe deter- 
minar en cada etapa del experimento (por ejemplo, después de j 
subpruebas), las pérdidas medias mínimas que sufrirá el estadista 
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tomando la mejor de todas las decisiones posibles incluyendo la de 
que el experimento debe continuarse. Por cuanto la toma de deci- 
sión se basa en los conocimientos de la distribución aposteriorís- 
tica de probabilidades £,(8) la función de riesgo dependerá tam- 
bién de esta distribución. Designemos por p*(£) la función de 
riesgo que se obtiene después de realizar j subpruebas. 

usquemos consecutivamente, partiendo de la última etapa del 
experimento, las expresiones que definen la función de riesgo. Su- 
pongamos que se han realizado lodas las N subpruebas. y está 
hallada la distribución apriorística de probabilidades E(0). Las 
pérdidas medias que sufre con esto el estadista al tomar la deci- 
sión a & A son: 


L (En, a) =2 L (8, a) Ey (0). (9-57) 


El valor minimo de estas pérdidas correspondiente a ła solución 
de Bayes a* se determina por la expresión 


REN =L (En, 4) = min L (Ey, a). (9-58) 


Por cuanto no es posible tomar ninguna decisión mejor que a*, 
la magnitud R*(Ey) va a coincidir en esta etapa del experimento 


con la función de riesgo 
P* (Em) = R° (Ey). (9-59) 


Examinemos ahora una etapa arbitraria del experimento y ha- 
Memos las pérdidas medias mínimas que sufrirá el estadista des- 
pués que realizó j subpruebas (j == 0, ++, N — 1). En este caso 
él dispone de la distribución de probabilidades E,(0). 

En el caso dado el estadista puede obrar de dos maneras, 

1. Puede poner fin al experimento y tomar la decisión a Œ A, 
Las pérdidas medias mínimas que él sufre son: 


R" (&) mín L (8, a) =mín È L (8, a) y (0). (9-60) 


2. Puede tomar la decisión de realizar la subprueba (¡-+ 1). 
En tal caso va a sufrir, en primera, las pérdidas iguales al costo 
de la prueba las cuales tomamos como unidad, y, en segunda, las 
pérdidas que sufre después de tomar la mejor decisión por los re- 
sultados de la observación (j -+ 1), es decir, p* (Eju1). 

No obstante, el estadista no sabe la distribución de probabili- 
dades Es41(0). Conoce sólo lá distribución E,(0) y únicamente 
puede determinar E;+1(0) por la fórmula (9-54) como TE,(0). Con 
esto, la magnitud 75,(0) puede ser hallada para los valores con- 
cretos de 254 Œ Zj y 00 que el estadista no conoce por 
ahora. Por esto no debe referirse a un valor concreto de la función 
de riesgo p*(E;41), sino únicamente al valor medio M [p*(7Ey)), por 
cierto, el promedio debe tomarse por todos los valores posibles de 
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251 E Zi con la distribución de probabilidades go (2;51) y por 
todas las © € O con la distribución de probabilidades E,(0): 


Mle (TEN = 2 o° [TE/(0)] do (2141) £; (0). (9-61) 
Ele 


De este modo, las pérdidas minimas del estadista en caso de 
que decida continuar el experimento, son: 


1+ M [0° (TE) (9-62) 


Después de realizar j subpruebas la función de riesgo se deter- 
mina por el minimo de pérdidas medias al examinar ambos méto» 
dos de operación del estadista: terminación del experimento y con- 
tinuación del mismo. Por tanto, 


p° E) = min {R° (E), 1+M lo" (TE). (9-63) 


La expresión (9-63) puede esctibirse de modo más compacto 
sin emplear el subíndice j que designa el número de la subprueba. 
Vamos a examinar la etapa del experimento en que hasta su termi- 
nación quedan k subpruebas. Designemos por E(0) la distribución 
aposteriorística de probabilidades en esta etapa y por E(0)= 
= Tg(0) la distribución aposteriorística de probabilidades después 
de realizar una subprucba más. Designemos por p; (8) la función 
de riesgo en la fase cuando hasta el final del experimento quedan 4 
subpruebas. Entonces las expresiones (9-59) y (9-63) se escriben 


en la forma 
05 (5) = R (E); (9-64) 
ph È) = mín {R° ($), 1+ M [p}i (78)])- (9-65) 
Designemos por V el espacio ide resultados de la subprueba 


siguiente cuyos elementos vamos a designar por v. Con estas 
designaciones obtenemos: 


R" ($) = min È L (6, a) $ (8); (9-66) 

M [phi (TEJ = Z Ph [TE (0) 9, (0) E (0); (9-67) 
_ ¿Mal å 

TE On (9-68) 


Las fórmulas (9-64) y (9-65) pueden utilizarse para deter- 
minar los dominios de parada. Sin embargo, sólo se obtienen re- 
sultados relativamente sencillos para el problema de dos alterna» 
tivas a cuyo estudio nos limitaremos en lo adelante. 
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e) Determinación de los dominios de parada 
para el problema de dos alternativas con muestra 
consecutiva truncada 


Examinemos el caso del problema de dos alternativas con fun- 
ción de pérdidas determinada por la matriz 


O qu 
alo l pan 


y con la distribución de probabilidades en el espacio de estado de 
la naturaleza £(0)= (£, 1 —¢). Designemos por An (a1) y An (a2) 
los dominios de parada correspondientes a las soluciones a, y az 
cuando hasta el final del experimento quedan por realizar £ obser- 
vaciones, Estos dominios se determinan por los valores b = ðr 
y E = yn ya < da tales que 


Ala) =[6:<3< 1), Arlaj=[0<3< ya). (9-70) 


La determinación de las zonas de parada se reduce a deter- 
minar los valores de ya y ör para k=0, 1, ..., N. Esto puede 
hacerse utilizando las expresiones obtenidas para la función de 
riesgo. 

Iniciemos la determinación de los puntos límites de los domi- 
nios de parada partiendo de k = 0. Al expresar £(0) por £, se ob- 
tiene de (9-64) y (9-66): 


Ps (6) =R* (2) = mín [(1 — 8) ay q]. (9-71) 


Según (9-56), Ao(aı) y Aolaz) deben ser conjuntos reales no 
intersecados cuya reunión proporciona el segmento cerrado 0,1. 
Por consiguiente, estos dominios deben estar separados uno del 
otro por el punto E = yo = ôs que se determina por la condición 


(1— 2) qu =Eq1 (9-72) 
La condición (9-72) es la condición de igualdad de las pérdidas 


medias mínimas al tomar las decisiones a, y az. De (9-72) halla- 
mos: 


v=%b= TEs qa (973) 
Para k 0 arbitraria la función de riesgo tiene la forma: 
Ph (2) = min {R (2), 1 + M[oj_,(70)]): (9-74) 


Las condiciones de obtención de los valores límites £ para los 
conjuntos Ar(a1) y A»(as) serán las condiciones de igualdad de 
las pérdidas medias mínimas al tomar la decisión a, o az y al de- 
cidit continuar el experimento, lo que se expresa mediante la rela- 


ción 
R()=1+M[o3_,(72)]. (9-75) 
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Observando que en lá expresión (9-71) para R*(£) la magnitud 
£ga, es la función monótonamente creciente £, que se vuelve cero 
para £ = 0 y (1 — £)q,2 es la función monótonamente decreciente E 
que se convierte en cero con £ = L, y sustituyendo en los puntos 
límites £ por ya para el dominio Ax(az), y por 6, para el dominio 
An(a1), podemos escribir (9-75) en la forma 


Yala =1 + M [Phi (TY); (9-76) 
O 8s) a= 1 + M [oh (T) (9.77) 


Estas condiciones se representan geométricamente en la figu- 
ra 9-10. 


O delas) Ya vendo da) Y 


Fig. 9-10. Determinación de los dominios de parada en el problema de dos al- 
ternativas 


Las relaciones obtenidas muestran que el problema de determi- 
nar ya y Ör así como las funciones de riesgo p; (£) se reducen a 
calcular la magnitud Mf[p;,_, (7€)]. La fórmula (9-67) da la expre- 
sión general para esta magnitud con una O arbitraria. Para el 
problema de dos alternativas esta expresión adquiere la forma: 


Mipi (16)]=5 E oi (00 90, (0) + 
+00 [TU 019,60, (8-78) 


donde desta) 
SH j- 
T= a F i O * 07 
U= 8) o, (0) y 
TOO F 00" GSD 


Para k= 1 la función ø}(¢) determinada por la expresión 
(9-71) es una función muy sencilla de ¢, así que la magnitud 
M [p (72)] puede determinarse directamente mediante (9-78). Co- 
nociendo M[p¿(7%)] puede calcularse oi) por (9-74), lusgo de- 
terminarse M [p; (7€)] por (9-78) y de aquí, pz (£) mediante (9-74), 
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etc. Aunque este proceso de 


búsqueda de p;(£) requiere grandes 


cálculos, sin embargo, en este caso no es necesario efectuar ope- 
raciones más complicadas que la búsqueda de las esperanzas ma- 


temáticas. 


PROBLEMAS PARA EL CAPITULO 9 


(10,0) 


(0,1,0) (0,0,1) 


Fig. 9-11. Espacio de estrategias 
mixtas de la naturaleza para el ca» 
so de tres estados de la naturaleza 


man el espacio de estrategias m 
igual a la unidad como se muesti 


construcción geométrica en la figu- 
ra 9-6, 

9-3. Por un canal de comunicación se 
transmite la señal u sobre la cual está 
superpuesta la interferencia s distribuida 
por la ley normal N(0, 0%) de suerte que 
en la parte de recepción se mide la mag- 
nitud Z=u-+s. La señal u puede to- 
mar dos valores: u = 0, no hay señal 
(01) y u = uo = const, hay señal (07). 
El dispositivo de recepción tiene el um- 
bral zo y suministra la decisión de que se 
ha transmitido la señal uy si z> zo. 
Determinar la magnitud del umbral zo 
utilizando el método de resolución del 
problema de dos alternativas haciendo 
C= 025 y w= 2. 

9-4. Demostrar que en el caso de 
tres estados de la naturaleza © = 
= (01, 02, 03) todas las estrategias mix- 
tas del estadista 50) == (Li da Lo) for- 

las que tiene forma de triángulo con altura 
ti la figura 9-11, 


Capítulo décimo 
PROGRAMACIÓN DINÁMICA 


10-1. CONTROL OPTIMO COMO PROBLEMA VARIACIONAL 


a) Enunciado matemático del problema de control óptimo 


La tendencia característica en la construcción de los sistemas 
de control automático modernos es la aspiración de lograr sistemas 
que sean los mejores en determinado sentido. En el caso de control 

le procesos tecnológicos esta tendencia se pone de manifiesto en 
obtener una cantidad máxima de productos de alta calidad con 
empleo limitado de recursos (materias primas, energía, etc.). En 
los sistemas de control de naves, aviones y cohetes se tiende a mi- 
nimizar el tiempo después de cuyo transcurso el objeto sale al pun- 
to o trayectoria deseados, limitándose el ángulo de desviación de 
los timones, la cantidad de combustible consumido, etc. En los 
sistemas de seguimiento y estabilización tiene importancia alcan- 
zar una precisión máxima existiendo todas las limitaciones po: 
bles impuestas a las coordenadas del objeto controlado, los elemen- 
tos ejecutivos y el regulador. En todos estos ejemplos los proble- 
mas de control se reducen a Ja búsqueda del mejor proceso en 
determinado sentido de la palabra, de entre el conjunto de los 
procesos posibles, es decir, pertenecen a la clase de los problemas 
dinámicos de control. 

Como se mostró en el capítulo 6, el enunciado matemático de 
los problemas dinámicos de control automático se reduce a lo si- 
guiente, Hay un objeto controlado cuyo estado se caracteriza por 
la variable multidimensional x =(x0, ..., x). Puede cambiarse 
el carácter de los procesos en el objeto controlado utilizando uno 
u otro procedimiento de control u del espacio de procedimientos de 
control admisibles U. En el caso general el control uE U puede 
ser asimismo la magnitud multidimensional u =(40, ..., um), 

El carácter del movimiento del objeto controlado se describe 
por medio del sistema de ecuaciones diferenciales 


=g(x, u), x(0=0. (10-1) 


Como criterio de calidad de control se emplea la estimación por 

la integral de la forma 

SRE] ž 

Laoac o Y AO, «a, (10-2) 
RETA 
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que tiene el sentido físico de pérdidas, donde T es el tiempo en que 
transcurre el proceso controlado y Qi[x(f), u(£))= qı (f) son las 
pérdidas instantáneas en el momento £ con el estado del sistema 
x(t) y el control u(t). Pueden ser limitaciones adicionales impues- 
tas a la cantidad de recursos o los límites de variación de algunos 
parámetros que se expresan mediante la relación matemática 

r 


$ HIx(0, u Oldi < K, (10-3) 
è 


que coincide con (6-33). 

Como quedó establecido en el capítulo 6, se denomina óptimo 
aquel control u del conjunto de controles admisibles U con el que 
para el objeto descrito por la ecuación diferencial (10-1) y las li- 
mitaciones impuestas a los recursos utilizados (10-3), el criterio 
de calidad de control (10-2) adquiere el valor minimo (máximo). 

El problema de control óptimo formulado de este modo perte- 
nece a la categoría de los problemas variacionales de cuya resolu- 
ción se ocupa la rama de las matemáticas que recibió la denomina- 
cion de cálculo variacional. La magnitud Ji (u) determinada por la 
relación (10-2) recibió el nombre de funcional. A diferencia de una 
función, por ejemplo, f(x) cuyos valores numéricos se presentan 
en el conjunto de valores del argumento x, los valores numéricos 
de la funcional J, (u) se presentan en el conjunto de todos los con- 
troles posibles u(t). El problema de la búsqueda del control óptimo 
se reduce a elegir de entre el conjunto de controles admisibles u(t) 
aquel con el que la funcional Ji) adquiere el valor numérico 
mínimo. 

Corrientemente, los problemas que requieren la minimización 
de la funcional del tipo (10-2) subordinada a la relación de dife- 
rencial (10-1), al existir la limitación de integral (10-3), se susti- 
tuyen por la minimización de la nueva funcional 


T r 
J= | Qi (x, udt +A | H (x, wal, (10-4) 
è ¿ 


subordinada únicamente a la relación diferencial (10-1). El pará- 
metro A de la funcional (10-4), que recibió el nombre de factor de 
Lagrange; representa en los problemas de optimización de control 
el papel del “precio” de los recursos limitados. Su valor se halla 
por las condiciones limites del problema variacional. 

La posibilidad de simplificar el problema variacional con las 
limitaciones de integral mediante la introducción de los factores 
de Lagrange se desprende del siguiente teorema. 

Teorema 10-1. Si u(t) es el control óptimo con el cual la fun- 
cional (10-4) alcanza el mínimo absoluto y se cumple la limitación. 
(10-3), entonces con u(t) se alcanza el minimo absoluto de la fun- 
cional (10-2) subordinada a la limitación (10-3). 
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La demostración es por el absurdo. Sea v(t} otro control dis- 
tinto de u(t), por cierto, tal que 


7 7 
Y Quix, orde < | Qi (x, udt (10-5) 
è è 
y se cumple la condición 
1 
| H, Dd<K. (10 6) 
è 
Entonces 
7 r 7 
$ Qi (x, o)dt +2 | H (x, 0) de< | Qrt, o) dt +K < 


r T 7 
< | Qt, di4 aK = f Q) de 42 | Hudi, (10:7) 
9 0 o 


lo que contradice la suposición de que (1) minimiza (10-4). 

La aplicación de los métodos de cálculo variacional al problema 
de la búsqueda del control óptimo no se difundió a causa de una 
serie de dificultades. Por lo tanto, no vamos a detenernos en los 
métodos de resolución del problema variacional remitiendo a los 
interesados en esta cuestión a la literatura correspondiente, Seña- 
laremos únicamente algunas cuestiones de importancia para la 
exposición ulterior. 

Un importantísimo concepto de cálculo variacional es el de 
variación de función que durante la investigación de las funciona- 
les juega el mismo papel que la diferencial al investigar las fun- 
ciones. 

Sea f(x) una función continua en el intervalo [a, b). Examine- 
mos el punto interior x de este intervalo y cierto valor fijo de la 
diferencial del argumento de la función Ax = dx. La diferencia 


Fix + Ax) — f (x) = df (x) = j’ (x) Ax (10-8) 


se llama diferencial de la función f(x) en el punto x. Como se 
sabe, la condición df(x)= 0 es la condición necesaria de minimo 
(máximo) de la función f(x) en el punto x. 

Para lograr analogía con el cálculo variacional es conveniente 
determinar la diferencial df(x) de manera algo distinta. Examine- 
mos el valor de la función f(x + eAx); para x y Ax fijadas éste 
será función de e. Diferenciando esta función por e y haciendo 
£ =0, obtenemos: 


Ei e + edx) lo =f" (0) x= dj (2). (10-9) 


Em 


Examinemos los conceptos análogos de cálculo variacional. 
Sean u(t) y us (1) dos controles utilizados. La diferencia 


òu (t) = u (0 — u(i) (10-10) 
se denomina variación de la fùnción u(£) y la diferencia 
ÒI (u) = J (u + õu) — J (u) (10-11) 


se llama variación de la funcional. 
La variación de la funcional puede definirse de otro modo. Para 
esto examinemos con u (£) y òx (f) fijadas la funcional 


J(u + edu) = (e), (10-12) 


que es la función de e. Supongamos que dicha funcional está de- 
terminada para diferentes e, lo cual significa que son posibles 
distintos controles w(1)-E eu (£) en las cercanias del control fijado 
u(t), o sea, u(t) es un punto interior del espacio de controles ad- 
misibles U. Entonces, la variación de la funcional puede definirse 
por analogía con la diferencial de la función que está dada por la 
relación (10-9) como 


8 (u) =$ I (u + edu) lomo. (10-13) 


Si u(t) es el control óptimo, la función p(e) va a alcanzar su 
mínimo con e == 0. En este caso 


R | a= G I e sdn) bao = 0, (10-14) 


es decir, ðJ (u) = 0. Así pues, el control óptimo será aquel con el 
que la variación de la funcional se vuelve cero. 

La condición 5/(u)==0 se utiliza en el cálculo variacional 
para obtener la llamada ecuación diferencial de Euler entre cuyo 
conjunto de soluciones se halla después el control u(t) que mini- 
miza la funcional (10-4). 


b) Dificultades relacionadas con la resolución 
del problema variacional 


Al buscar el mando óptimo: por métodos variacionales nos en- 
frentamos con una serie de dificultades algunas de las cuales tie- 
nen carácter de principio: 

1) los métodos variacionales sólo dan la posibilidad de hallar 
los máximos y mínimos relativos de la funcional J(u) mientras 
que nos interesa encontrar el máximo o mínimo absolutos; 

2) para muchos problemas técnicos las ecuaciones de Euler no 
resultan lineales lo que frecueritemente imposibilita obtener la so- 
lución del problema variacional en forma explícita; 

3) por lo común, los valorés de las señales de control llevan 
impuestas limitaciones que hacen imposible la búsqueda del con- 
trol óptimo por los métodos variacionales. 
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Por cuanto esta última circunstancia tuvo una importancia de- 
cisiva para el desarrollo de nuevas ideas en la rama del control 
óptimo, nos detendremos en ella más detalladamente. 

Las limitaciones que se imponen habitualmente a las señales 


de mando son del tipo 
PACICIIA (10-15) 


lo que significa la necesidad de limitar la magnitud de las señales 
suministradas a los órganos de mando, Así, están limitados la 
tensión máxima suministrada al inducido de un motor eléctrico, el 
ángulo de rotación máximo del ión de un avión, la temperatura 
máxima en la cámara de combustión de un motor a reacción, etc. 
Por cierto, el logro de procesos óptimos requiere por lo general 
que se mantengan las señales de mando en sus valores extremos, 
10 que corresponde al transcurso más rápido y efectivo de los pro- 
cesos en el objeto controlado. El carácter del cambio de control 


Fig. 10-1. Aspecto caracteristico de la señal de mando óptima 


u(t) típico para estos casos con proceso óptimo se muestra en la 
figura 10-1. 

Sin embargo, los valores límites del control u(t) se encuen- 
tran en los límites del dominio de controles admisibles U y, por 
ende, no son puntos interiores de este dominio para los cuales sola- 
mente son útiles los métodos variacionales. Verdad que es posible 
librarse de las limitaciones del tipo (10-15) introduciendo nuevas 
variables v relacionadas con las variables u; mediante la correla- 
ción u; = M; sen v; Con esto, a los valores |u| = M; van a co- 
rresponder v; = +x/2 que son puntos interiores del dominio de 
nuevos controles admisibles. No obstante, este cambio de variables 
conduce, por lo común, a considerables complicaciones de las ecua- 
ciones obtenidas. 

Las dificultades existentes en el camino de la resolución del 
problema de optimización del control provocaron un intenso estu» 
dio del problema de los procesos óptimos por diversos científicos 
en la URSS y los EE. UU. Los matemáticos soviéticos L. $. Pon- 
triagin y sus discipulos V. G. Boltianski, R. V. Gamkrelidze y 
E. F. Mischenko crearon la teoría del control óptimo que se basa 
en el principio del máximo formulado por L. S. Pontriagin. Este 
principio permitió asentar la teoría del contral óptimo sobre un 
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riguroso fundamento matemático y abrió amplias posibilidades 
para su aplicación práctica en la rama de los sistemas de control 
automático. Sin embargo, en el presente libro no disponemos de la 
posibilidad de profundizar la teoría generał del control automático 

asada en el principio del máximo y en este sentido rogamos refié- 
ranse a la literatura al efecto. 

Otro modo de tratar el cálculo de los procesos óptimos fue de- 
sarrollado por el matemático norteamericano R. Bellman y recibió 
la denominación de programación dinámica. El método de progra- 
mación dinámica pone en manos del ingeniero un procedimiento 
de cálculo eficaz para resolver el problema de la optimización del 
control y está bien adaptado para el empleo de las calculadoras 
numéricas. Examinemos más detalladamente este método. 


10-2. METODO DE PROGRAMACION DINAMICA 


a) Forma discreta (discontinua) del problema variacional 


Las dificultades examinadas de resolver el problema variacio- 
nal se superan utilizando métodos de cálculo eficaces uno de los 
cuales es el método de programación dinámica. Este brinda la 
posibilidad de hallar el control óptimo en los problemas de pasos 
múltiples. No obstante, puede utilizarse también para resolver los 
problemas variacionales si éstos se presentan en forma discreta. 

Recurriendo al teorema 10-1, enunciemos el problema variacio- 
nal de la forma siguiente: hallar para el objeto descrito por Ja 
ecuación diferencial (10-1) el control (1) del dominio de contro- 
les admisibles U que minimiza la funcional 


r 
1(9=1 Q lxt), (0d, (10-16) 
è 


donde 
Q(x, u) = Q; (x, u) + AH (x, u). (10-17) 


Obtendremos la forma discreta de notación de este problema: si 
realizamos la elección del control 4(t) solamente en los momentos 
discretos t = kô, 0, 1, ..., n—1, donde ô = T/n. Con esto, 
en lugar de la función x(t) y u(f) vamos a examinar las secuen- 
cias 


Xemx (i) koro Ue =u (f) k nro- 


Substituyendo la derivada’ = dx/dt en la ecuación (10-1) por 
Ja relación de los incrementos (Xr+; — xx)/6 en lugar de la ecua- 
ción diferencial (10-1) obtenemos la ecuación de diferencias finitas 


Fr 


=8 (£r, Us). (10-18) 
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De ordinario, esta ecuación se escribe en forma más cómoda re- 
solviéndola con respecto a Xa+: 


Kira = Xr H g (Ya, Uad; R=0,1,..., n—l, xp==c. (10-19) 
En este caso la integral (10-16) se sustituye por la suma 


Jalu) = 2,Q(%a, us) O, (10-20) 


donde por u se entiende la secuencia de ecuaciones empleadas 
u= (lg, -p gi). (10-21) 


Ahora el problema consiste en elegir los controles to, ti, ... 
++», Uni que garantizan el valor mínimo de la suma (10-21). 

En muchos problemas de control resulta conveniente considerar 
ò = l. Es particularmente cómodo hacerlo en los casos en que el 
proceso se divide en forma natural eh pasos separados y, con esto, 
en los limites de cada paso el control u(t) se mantiene invariable. 
Con esto llegamos al proceso de contro! de pasos múltiples estu- 
diado en el capítulo 6 en el que xa y un significan el estado del 
objeto y el control utilizado al comienzo de cada paso. Designando 
en este caso 


Xr + g (2r 44) = T (Xr, Ha), (10-22) 
escribiremos la ecuación (10-19) en la forma 
Xr =T (Xp s); k=0, 1, ..., n=l; x=c, (10-23) 


que coincide con la expresión (6-52) la cual define la transiorma- 
ción del estado del objeto durante un paso en el proceso de control 
de pasos múltiples. La suma (10-20) con ò= 1 toma la forma de 


ant 
Ja (u) = La. us), (10-24) 


que coincide con la expresión (6-54) para el criterio de calidad en 
el proceso de control de pasos múltiples. 

En lo adelante vamos a estudiar el método de programación 
dinámica con arreglo a las relaciones (10-23) y (10-24), o sea, 
conforme al proceso de contro] de pasos múltiples. No obstante, 
la relación que hemos determinado entre las formulaciones mate- 
máticas del problema variacional de forma discreta y el proceso de 
control de pasos múltiples, permite asimismo extender los resulta- 
dos recibidos a la resolución de los problemas variacionales. 


b) Relaciones recurrentes del método de programación 


dinámica 
La optimización del control de un proceso de n-ésimo paso 
consiste en hallar la secuencia de controles lío, ti”... , Uni, CON 


la cual el criterio de calidad Jn(u) toma el valor mínimo. Este 
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valor mínimo de dicho criterio de calidad de control del proceso 
de n-ésimo paso dependerá solamente del estado inicial xo y puede 
designársele como f (xo). Por definición tenemos: 


fa (a) = min mín ... min [Q (xo, 10) +Q (e, 4) +... 
pe AS vae Qla üni). (10-25) 


Notemos que el primer sumando de esta expresión, Q (xo, o), 
depende solamente del control so mientras que los demás suman- 
dos dependen tanto de uy como de los controles en otros pasos. 
Así pues, Q(x,, t) depende de u;, pero depende asimismo de o 
ya que xı = T (Xo, o). La situación de los sumandos restantes es 
análoga. Por eso, la expresión (10-25) puede escribirse en la forma 
Ín (%o) = min {Q (xo, uo) + mín ... mín de 
do uy Hn 


= 
X [Ql u) +... H Qla Unm) (10-26) 
Notemos más adelante que la expresión 
mín ... mín[Q(*, 4)+ -.- + Qla e)l (10-27) 
U a 
constituye el valor mínimo del criterio de calidad de control 
(1 — 1) del proceso de paso que tiene el estado inicial xı. De 


acuerdo con la definición (10-25) podemos designar esta magnitud 
por fn-1(x1). De este modo, obtenemos 


Fn (xo) = min IQ (xo, uo) + fami (%l- (10-28) 


Estos razonamientos pueden repetirse si se examina el proceso 
de paso (n— 1) que comienza por el estado inicial xı. El valor 
mínimo del criterio de calidad de control para este caso es 


Iai 00) = mín [Q (xi 4) + fa- 0); (10-29) 


Al continuar estos razonamientos obtenemos una expresión aná- 
lóga para el proceso de paso n — 1 que comienza por el estado xr: 


fami (x1) = mín [Q (xr, u) + fa-a+0 (r4). (10-30) 
N. 


La ecuación (10-30), que frecuentemente se denomina ecuación 
de Bellman, constituye una relación recurrente que permite deter- 
minar consecutivamente el control óptimo en cada paso del proceso 
controlado. 

La propia idea de optimizar el control por separado en cada 
paso, si es difícil optimizar đe una vez todo el proceso entero, no 
es original y se utiliza ampliamente en la práctica. No obstante, 
con frecuencia no se tiene en cuenta que la optimización de cada 
paso no significa aún la optimización de todo el proceso. Así pues, 
el sacrificar una figura en una partida de ajedrez nunca es venta: 
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joso desde el punto de vista de una jugada aislada, pero puede 
serlo considerando toda la partida. El gasto de recursos para la 
amortización no puede ser beneficioso desde el punto de vista de ta 
coyuntura en un momento determinado, pero es beneficioso exami- 
nando el trabajo de la empresa durante un periodo prolongado. 

La peculiaridad del método de programación dinámica consiste 
en que reune la sencillez de resolución del problema de optimizar 
el contro] en un paso separado con la previsión de que toma en 
cuenta las consecuencias más lejanas de este paso. 

En el método de programación dinámica la elección del con- 
trol en un paso separado se realiza no desde el punto de vista de 
los intereses del paso dado que se manifiestan en la minimización 
de las pérdidas en dicho paso, es decir, la magnitud Q (xn 41), sino 
desde el punto de vista de los intereses de todo el proceso que se 
traducen a la minimización de las pérdidas sumarias Q (xp 44) + 
+ fn-a+1) (X1+1) en todos los pasos siguientes. De aquí se deriva la 
„propiedad fundamental del proceso óptimo consistente en que sean 
cuales sean el estado y el control iniciales, los controles siguientes 
deben ser óptimos respecto al estado que es consecuencia de la 
utilización del primer control. 

De la propiedad fundamental del control óptimo se desprende 
que la optimización del mismo para una etapa arbitraria de un 

roceso de pasos múltiples consiste solamente en la elección de 
os controles siguientes. Por esto suele ser más cómodo tomar en 
consideración no aquellos pasos que ya se han dado sino los que 
quedan por dar para llevar el proceso a su estado final. Desde este 
unto de vista es conveniente escribir la ecuación (10-30) en otra 
jorma. 

En la expresión (10-30) la magnitud n — | significa el número 
de pasos hasta el final del proceso. Designemos esta magnitud 
por k. Entonces, vamos a designar las magnitudes x; = Xn-p y 
uy = Un. sencillamente por x y u. Estas van a significar el estado 
del objeto y el control utilizado £ pasos antes del Final del proceso. 
Designemos por x” el estado siguiente, es decir, al cual el objeto 

asa del estado x al emplear el control u. Esto va a ser Xn-«a1) en 
as designaciones anteriores. Con esto la ecuación (10-23) se escri- 


birá en la forma 
x =T (x, u), - (10-31) 
y la relación recurrente (10-30) tomará la forma: 
h= uin IQ (x, u) + fami C). (10-32) 


c) Aspectos de cálculo de la programación dinámica 


La programación dinámica es el mélodo numérico de resolu- 
ción del problema de optimización del control y por eso va acom- 
pañada de cálculos bastante complejos. Pero nosotros no vamos 
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a dar demasiada importancia a esta peculiaridad suponiendo que 
los cómputos necesarios se realizan con calculadoras electrónicas. 

La determinación del control óptimo en el f-ésimo paso arbi- 
trario, contado a partir del momento final del proceso, se encuentra 
fundándose en las relaciones (10-31) y (10-32), las que para más 
comodidad conviene escribir en forma un tanto diferente al efec- 
tuar los cálculos numéricos. Designemos por Fa(x, u) la magnitud 
del criterio de calidad de control de un proceso de k-ésimo paso 
con el control óptimo en los últimos k— 1 pasos y el control arbi- 
trario en el paso inicial. Entonces, la relación (10-32) puede escri- 
birse en la forma 


Fe(x, u) =Q (x, u) + fir (4); (10-33) 
fr (x) = mín Fa (x, u), (10-34) 


donde x’ se determina por (10-31). 

Las variables x y u pueden tomar conjuntos finitos de valores 
o cambiar continuamente en algunas gamas. En el último caso 
efectuaremos la discretización de estas variables separando de 
ellas los conjuntos finitos de valores en lo posible equidistantes. 
Luego, en ambos casos las variables x y u pueden considerarse 
cómo elementos de los conjuntos finitos X = (x0, ..., xd) y 
U = (uib, ..., w}. Es cómodo calcular por anticipado el valor de 
Q(x, u) y presentarlo en forma de tabla con el producto directo de 
los conjuntos X X U. Esta tabla deberá conservarse en la memoria 
de la calculadora electrónica, 

Los cálculos por las fórmulas (10-33) y (10-34) se realizan 
llenando la tabla 10-1. En las dos primeras columnas de la tabla 
están enumeradas diversas combinaciones de xs X y u €= U. Las 
demás columnas se llenan calculando las magnitudes correspon- 
dientes. En las últimas columnas de la tabla, para cada x= X se 


Tabla 10-1 
Tabla de cálculo por el método de programación dinámica 


f “ ST (x, 6) Qix. m 
x0) ui) T(xÚD, u) Qiri, ut) 
wir T, ut) QW, ut) 
x alo TD, u) QU, u) 
uin T (x8, ut) QUD, al) 
xI ray ... . a 
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Continuación de la tabla 10-1 


(i ys A i 
x) ha re 69 um) Tet h; a ) Pat) è 
Pai IT, u) Fe (xt, ut) 
xh ha IT, am) Pata My u0) Fa (x9) u 
frl (x, u) Pared, u) 


escribe el valor mínimo de Fa (x, 4), es decir, se determinan fa (x) 
y el control óptimo 1”. 

Es necesario realizar cálculos similares para cada paso del 
proceso de pasos múltiples. En este caso hay que tomar en consi- 
deración que para determinar f,(x) hace falta disponer A 
mente de la tabla para fh-,(x) ya que con su auxilio se hallan los 
valores de fa~: (x°) al Menar la tabla 10-1. Por tanto, los valores de 
fa— (x) deben calcularse antes que los valores de fa (x). De aquí se 
desprende que es preciso comenzar a calcular las funciones f, (x) 
desde el último paso del proceso de pasos múltiples. Notando que 
pos 0, como etapa inicial del cálculo debe tomarse k = 1, para 
a cua 


F(x, u) = Q(x, u); fi (x)= min Q(x, u). (10-35) 


p En Jo sucesivo el cálculo se realiza del modo habitual para 
=23,....n. 

Después de efectuar los cálculos y componer las tablas para 
h(x) y u* con k= l, ..., n, puede comenzarse la búsqueda del 
control óptimo para todo el proceso con las condiciones iniciales 
dadas xo. Por la tabla para [o(2) se halla u; correspondiente a 
la xo dada y se calcula xı = T (xo, u). Más adelante, por la tabla 
para fa- (x) se halla u correspondiente a la x, hallada y se cal- 
T(x,. u¡), etc. Como resultado obtenemos el control óp- 
timo (15, Mc. 4,1). 

En caso de que u sea la magnitud continua, Fa(x®, u) será 
función continua de u. Pero la tabla 10-1 da únicamente los valo- 
res discretos de Fa (x9, u®), ¡=1, .... r de esta función, Con esto 
puede obtenerse el valor mínimo de Fa (x9, u) en los valores inter- 
medios de u. En este caso deben determinarse las magnitudes u* 
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y fa (x) utilizando las fórmulas de interpolación. También es ne- 
cesario emplear las fórmulas de interpolación para determinar el 
control óptimo u, en los casos en que los valores de xr = 


= T (Xh-1, Un-1) van a encontrarse entre los valores de x que for- 
man parte de la tabla 10-1. 


Ejemplo 10-1, Problema de la toma de altura. Un avión vuela con veloci- 
dad de vo a una altura de fo. Es necesario cambiar su velocidad hasta o, y su 
Alla hasta hy de modo que el gasto de combustible para este cambio sea 
minimo. 

Vamos a representar el proceso de cambio de v y 7 en el plano (v, h), Rea- 
licemos la discrctización de las variables dividiendo cada gama de cambio en 
cuatro intervalos. Entonces, los estados discretos del objeto controlado van a 
representarse como nudos de la retícula re- 
presentada en la figura 10-2. Consideremos 
que en cada nudo de la retícula sólo pueden 
emplearse dos controles: 

Uy = 0, solamente el cambio de la velo- 
cidad 

u 
rah, 

De este modo, el conjunto de controles 
admisibles será el conjunto U = (0, 1). 

En la figura 10-2 está representada una 
de las trayectorias posibles correspondiente 
al control u = (01011001), Para estimar 
esta trayectoria hay que conocer el gasto de 
combustible en cada paso. Esto será preci- 
samento la función de obleivo Q(x, u), Pre: 

a taremos los valores de Q(x,u) en forma 

Fig. 10-2. Trayectoria en el de nimeoa 
s convencionales con los cuales en 
problema de la toma de altura {fa figura 10.2 está marcada cada una de las 
transiciones posibles. Para la trayectoria re- 
presentada en la ligura 10:2 el gasto sumario de combustible que representa los 
ae EN io de eficacia de control es igual a: 44+4474+54+7+4+8+ 

+948 =m 

Para representar el proceso estudiado como de pasos múltiples, introduzca» 
mos el método conveniente para describir los estados del objeto controlado. 
Señalemos los valores discretos v con los números del O al 4 comenzando por 
el valor final. Obremos del mismo modo respecto a h. Entonces, xi, va a sig- 
nificar el estado para v = i y A == j a partir del cual quedan por dar (+ j pa- 
sos hasta el final del proceso. 


1, solamente el cambio de la altu- 


Tabla 10-2 
Cálculo del contro! óptimo en el último paso 
Xio Xoo 9 9 0 
t m w 
xa o - - 8 1 
1 o 8 
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Designemos por Xa el conjunto de estados con los que el proceso termina 
durante k pasos. Formarán parte de este conjunto todas aquellas xs, para las 
cuales i- j = k. Considerando que £ =0, l, 2, ..., obtendremos 


E {xn Xal Xa == {x20 Xun Xosh, ete. 


Ahora puede iniciarse la resolución del problema. Para k= 1 tenemos: 
X= bo di FARO (0 fa (x) =min Fi (x, u). 


Ulilicemos cstas relaciones para componer la tabla 10-2 de estructura simi- 
lar a la tabla 10-1. 


Tabla 10-3 
Cálculo del control óptimo en el penúltimo paso 
x u w Qin u) | hn | maw] ro us 
— m — 
0 9 9 8 
m Xio 1 18 ð 


Tabla 10-4 
Cálculo del control óptimo a tres pasos hasta el final 
— 
x u e Qies u) hin Prix, u) hia) ee 
o 6 18 
žo $e ze 2 o 
1 - o ES Es 
0 
dE EN 8 16 2 a i 
ža 8 18 26 
Hal LA A 
0 9 4 
än e j 2 22 1 
1 %a 6 16 22 
0 ie = - S 
xos 17 1 


14 17 
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Con k = 2, tenemos: 
Ke = (220, xin Xoh 
F(x, u) =Q (x, u) +f ix) fa (2) = min Fa (x, u). 


Utilicemos estas correlaciones pare componer la tabla 10-3, Los cálculos 
análogos se realizan para k = 3, 4... 

En el ejemplo examinado los datos contenidos en las tablas 10-2—10-4 
pueden representarse directamente en ef plano (v, A), señalando los valores de 
Ín(x) en forma del número en el nudo correspondiente de la fetícula, y de ur 
gon una flecha dirigida al nudo siguiente como se muestra en la figura 10-3. 
Después que se han determinado todos los valores de fa(x) y u* para todos los 
nudos de la retícula, hallamos la trayectoria óptima moviéndonos desde el 

nudo inicial en la dirección de las flechas. 
El control óptimo será us = (11000110) 
al cua) corresponde /n(ue) = 37, 


El ejemplo examinado ilustra per- 
fectamente las ventajas del método 
de programación dinámica. Dicho 
método, en primera, elimina el pro- 
blema del mínimo absoluto y rela- 
tivo, ya que pe el mismo proceso de 
¡cálculos está claro que siempre se 
halla el mínimo absoluto. En segun- 
da, las limitaciones del tipo |u| < 
< M: que son un serio obstáculo 
Fig. 10-3. Trayectoria óptima en para el empleo de los métodos varia- 
el problema "de la toma de al- cionales sólo facilitan el proceso de 

va cálculo por el método de programa- 

ción dinámica ya que reducen el do- 

minio de controles admisibles U. Por último, el método de progra- 

mación dinámica simplifica incomparablemente la búsqueda de la 

solución opa con respecto al método de simple selección de 
variantes. Esto puede ilustrarse mediante un cálculo elemental. 

Si en cada paso pueden haber r controles diferentes, en caso de 
selección directa cada uno de ellos debe examinarse en combina- 
ción con todos los controles posibles en todos los pasos restantes, 
lo que en el proceso del n-ésimo paso proporciona r” variantes. 
Incluso para un problema muy sencillo de pasos múltiples con 
r = 10 y n = 10 se obtiene un número enorme 10' de variantes. 

En A método de programación dinámica, al elegir el control en 
algún paso para el estado x, no se examinan todas las continuacio- 
nes posibles sino solamente aquellas que corresponden a las conti- 
nuaciones óptimas del estado x’ = T(x, u). Esto permite excluir 
del examen una enorme cantidad de variantes que no son de inte- 
rés. De este modo, si en cada paso pueden haber m estados y para 
cada estado, r controles, el número total de variantes que se re- 
quiere examinar será rmn o rín si consideramos que r == m, es 
decir, que existe un control que convierte cada estado en cualquier 
otro nuevo. Con r=10 y a= 10 se obtienen en total 10% va- 
ríantes. 
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No obstante, pese a sus grandes ventajas, el método de progra- 
mación dinámica tiene sus inconvenientes, Estos consisten en que 
para hallar el control óptimo con cierto estado inicial del objeto 
es necesario ir desde ei final hasta el principio del proceso, deter- 
minando en cada paso los controles óptimos para todos los estados 
posibles del objeto en este paso. Y hasta el último momento per- 
manece desconocido cuál será el control óptimo para el estado ini- 
cial dado. Con esto, en definitiva resulta que la mayor parte de la 
labor de cálculo se realizó inútilmente ya que los resultados de la 
determinación del control óptimo no se utilizan para los estados 
que no se encuentran en la trayectoria óptima. En este sentido 
tiene ventajas el principio de máximo mencionado anteriormente 
que hace posible construir una trayectoria óptima tomada por se- 
parado, 


d) Control del estado final 


Como se indicó en el capítulo 6 en algunos problemas no in- 
teresa el carácter del movimiento del objeto durante el proceso de 
control y sólo importa el estado xn al que pasa el objeto cuando 
termina este proceso. En este caso servirá de criterio de calidad 
de control el valor de la función de objetivo al final de) proceso de 
control, o sea, la magnitud 


q=0(%,). (10-36) 


Designemos como antes por x y u el estado del objeto y el 
mando empleado por k pasos antes del final del proceso, y por 
x’ = T (x, u) el estado siguiente, es decir, el estado en k — 1 pasos 
antes del final del proceso. El estado x, y, vale decir, la función 
de objetivo g(x») se determinan tanto por el valor inicial de x 
como por todos los controles ulteriores. 

Para obtener la relación recurrente que determina el control 
óptimo, designemos por Fx (x, u) el valor de la función de objetivo 
4 (Xn) en k pasos hasta el final del proceso con el estado inicial x, 
el control arbitrario « en el paso inicial y el control óptimo en los 
k— 1 pasos restantes, y por fa(x) el valor q(x,) con el control 
óptimo en todos los œ pasos hasta el final del proceso, de suerte 
que 

fa) = mín Fr(x, u). (10-37) 


El valor F, (x, 4) puede obtenerse gracias a las consideraciones 
siguientes. Bajo la acción del control arbitrario u el objeto contro- 
lado en el paso inicial se pasa del estado x al estado x"=7(x, u 
Para obtener q(x») = Fn(x, 1) es necesario emplear en los k 
pasos restantes el control óptimo lo que da g(x»)= fr- (x)= 
=fr- [T (x, u)]. Este será el valor de F» (x, u). De este modo, 


Fa (x, u) = fr- 17 (x, u)). (10-38) 
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Sustituyendo los valores Fa(x, u) en (10-37), obtenemos 
Fa (0) = mín fas I7 (x, 191. (10-39 


La fórmula (10-39) es completamente análoga por su estruc- 
tura a la fórmula (10-32). Aplicándole el método de cálculos ya 
descrito y tomando en consideración que 


fox) =q (x), - (10-40) 


puede hallarse el control óptimo para cualquier estado inicial del 
proceso de pasos múltiples. 


e) Relación recurrente para los procesos de Márkov 


Examinemos el método de programación dinámica para optimi- 
zar los procesos estocásticos en caso de que dicho proceso sea una 
cadena de Márkov controlada. 

Como se mostró en el $ 5-6 la cadena de Márkov puede ser 
presentada en forma de matriz de probabilidades de las transicio- 
nes P = || p; || de orden L X L. Para que la cadena de Márkov 
sea controlada debe existir la posibilidad de cambiar las probabi- 
lidades de las transiciones p; mediante ingerencia del exterior. 
Supongamos q hay la posibilidad de llevar a cabo el proceso de 
Márkov por métodos diferentes, con esto, al método k corres- 
ponde la matriz de probabilidades de las transiciones P, =|] 
k= 1, ..., N. Llamaremos estrategia a cada método de realización 
del proceso de Márkov. 

En lo sucesivo vamos a considerar que tenemos la posibilidad 
de estimar cada método de realización del proceso, presentando 
la matriz de pérdidas o, lo que es más cómodo en el caso dado, la 
matriz de ganancias R, =[|r}}|. Las magnitudes rfp, i, ¡=1,... 
s L; k æ 4, , N expresan la ganancia en un paso al pasar 
el proceso del ado i al estado j en caso de utilizar la estrate- 
gia k. 

Ejemplo 10-2. La fábrica de televisores del ejemplo 5-9, hallándose en el 
estado 1, puede aumentar la demanda organizando su propaganda lo que, no 
obstante, exige gastos adicionales y disminuye los ingresos. Si la fábrica se 
encuentra en el estado 2, ella puede acelerar la transición al estado 1 aumen- 
tando los gastos de investigación. Entonces, ta estrategia 1 consiste en no su- 
frir gastos de propaganda e investigación y la estrategia 2, en efectuar dichos 

jastos. Las matrices de probabilidades de transiciones y de ingresos para es- 
as estrategias pueden ser las siguientes: 


0,5 0,5). 9 3l 
eos 0,6 * r |; pa E 

0,8 0,21. 4 4 
r=|os sal r=|; ul 
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Planteemos el problema de hallar el método de selección de la 
estrategia que garantice la obtención del ingreso máximo en n 
pasos del proceso de Márkov controlado. 

Designemos por f:(n) la magnitud máxima del ingreso en n 
pasos que comienzan por el estado ¿ Supongamos que del estado į 
se ha dado un paso al estado j con el ingreso rip y las restantes 
n — | transiciones se han efectuado de manera óptima. Con esto el 
ingreso completo en n pasos será 9 + f,(n— 1). 

No obstante, en realidad la primera transición del tipo (i, j) se 
realiza con una probabilidad pi, Por cuanto la primera transición 
es aleatoria, hay que tener en cuenta la posibilidad de pasar a to- 
dos los estados posibles ¡e (1, ..., N}. Por eso el ingreso espe- 
rado será igual a: 


N x 
F,in, h= D PRIR +a D]=99+ Y piyi (n— 1), (1041) 
donde la magnitud 
pipra (10.42) 


brinda el ingreso en un paso desde el estado ¿ con la estrategia k. 

Forma parte de la expresión (10-41) la estrategia k empleada 
en el paso inicial y con la elección correspondiente de la cual 
podemos garantizar el ingreso máximo esperado f;(n) lo que nos 
conduce a elegir la relación recurrente para elegir la estrategia k 
en el primer paso del proceso de n pasos: 


fi(n) = max [02 + È PAi (n — 2] a (10-43) 


Es cómodo efectuar el cálculo aplicando la fórmula (10-43) por 
el método tabular análoga al examinado en los párrafos anteriores. 
Mostremos las tablas correspondientes (tablas 10-5 y 10-6) para 
el problema del ejemplo 10-2 para n = 1 y n = 2. 


Tabla 10-5 
n=1 
1 | * no | po 
i 1 6 i 
2 
2 1 3 =3 1 
2 0,7 03 1 -19 | -5 
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Tabla 10-6 


n=2 
j Prp 
ile | # u'r menj a |r 
tfa e | os| o5} 3 | -8| 75 se | 2 
a |os|o2| 48 | —o6| 82 ` 
2 —3 | oaj o8 | 24 | —18 -7 | 2 


.- 
1 
a 
£ 
£ 
2 
& 
$ 
o 
1 
£ 
o 


Las tablas para n>2 se compitan según el lipo de la tabla para n= 


PROBLEMAS PARA EL CAPITULO 10 


opi 10L Continúe la resolución del ejemplo 10-1 y calcule toda la trayectoria 
ptima, 

10.2, Considerando la retícula de la figura 10-3 como grafo, halle la trayec- 
toria óptima aplicando los métodos de búsqueda del camino mínimo en el grafo 
del $ 22, Compare esta solutión con la solución por el método de programación 

inámica. 

10.3. Halle el control óptimo para el siguiente proceso de control de tres 
pasos de la magnitud escalar x. Al comienzo del proceso, x puede ser cualquier 
húmero entero de —10 a +10, En los diferentes pasos se realizan transforma- 
ciones del tipo x’ = T(x,u) =x-+u, con que los valores admisibles de u se 
determinan por los conjuntos: 


(1,0, E en el primer paso; 
(4, 0, +4} en el segundo paso; 
(9, 0, +9} en el tercer paso. 


El objetivo del proceso es levar en tres pasos la magnitud x hasta el 
valor deseando que se ha tomado igual a cero. Las pérdidas se estiman por el 
cuadrado de la desviación de x respecto a O al final del proceso, es decir, por 
la magnitud g(x) = (x — 0)? = x, 


A NUESTROS LECTORES: 


“Mir” edita libros soviéticos traducidos al español, inglés, 
francés, árabe y otros idiomas extranjeros. Entre ellos figu- 
ran las mejores obras de las distintas ramas de la ciencia 
y la técnica; manuales para los centros de enseñanza supe- 
rior y escuelas tecnológicas; literatura sobre ciencias natura- 
les y médicas. También se incluyen monografías, libros de 
divulgación científica y ciencia ficción. 


Dirijan sus opiniones a la Editorial “Mir”, 1 Rizhski per., 2, 
129820, Moscú, 1— 110, GSP, URSS. 


